مقایسه عملکرد دو روش‌ خوشه‌بندی‌ غیرسلسله‌مراتبی در داده‌های پوشش‌گیاهی

نوع مقاله : علمی- پژوهشی

نویسندگان

1 دکتری جنگل‌داری، گروه جنگل‌داری، دانشکده منابع طبیعی، دانشگاه ارومیه، ارومیه، ایران

2 نویسنده مسئول، استاد، گروه جنگل‌داری، دانشکده منابع طبیعی، دانشگاه ارومیه، ارومیه، ایران

3 استادیار، گروه ریاضی، دانشکده علوم، دانشگاه ارومیه، ارومیه، ایران

4 دانشیار، گروه جنگل‌داری، دانشکده منابع طبیعی، دانشگاه ارومیه، ارومیه، ایران

5 استاد، گروه اکولوژی، دانشگاه ایالتی مونتانا، بووزمن، آمریکا

چکیده

     هدف طبقه‌بندی پوشش گیاهی، بهینه‌سازی و خلاصه ‌کردن تغییرات آن به‌عنوان نماینده تغییرات محیطی است که سبب دسترسی به اطلاعات مفید و قابل‌تفسیر از بوم‌سازگان می‌شود. باتوجه‌به وجود تعداد زیادی از روش‌های طبقه‌بندی، انتخاب روش بهینه، چالشی بزرگ است. در پژوهش پیش‌رو، دو روش خوشه‌بندی غیرسلسه‌مراتبی شامل K-means و K-medoids برای بوم‌سازگان‌های جنگلی مقایسه شدند. داده‌های مورد استفاده در این راستا شامل دو مجموعه داده واقعی جمع‌آوری‌شده از نوشهر (جنگل‌های هیرکانی) و اسلام‌‌آباد غرب (جنگل‌های زاگرس) و شش مجموعه داده شبیه‌سازی‌شده بودند. برای آماده‌سازی داده‌ها از تبدیل داده هلینگر استفاده شد. سپس، سه روش اندازه‌گیری فاصله اقلیدسی، بری‌کورتیس و منهتن به‌کار گرفته شدند تا عملکرد دو روش غیرسلسله‌مراتبی مذکور بررسی شود. نتایج طبقه‌بندی به‌دست‌آمده از روش‌های مختلف با سه روش ارزیابی‌کننده سیلوئت، همبستگی فی و ISAMIC مقایسه شدند. نتایج نشان داد که ترکیب ماتریس تشابه بری‌کورتیس و روش‌های خوشه‌بندی K-means و K-medoids به‌ترتیب رتبه‌های اول و دوم را در بین خوشه‌بندی‌های مختلف داشتند. ضعیف‌ترین خوشه‌بندی مربوط به ترکیب ماتریس تشابه منهتن و روش K-medoids بود. روش K-means در داده‌های ناهمگن‌تر مانند داده‌های زاگرس و شبیه‌سازی‌شده، کارایی بیشتری داشت. همچنین، تبدیل داده هلینگر سبب بهبود عملکرد ضریب فاصله اقلیدسی شد. باتوجه‌به نتایج تحلیل‌های مربوطه، ترکیب روش خوشه‌بندی K-means و ماتریس تشابه بری‌کورتیس برای داده‌های جوامع گیاهی پیشنهاد می‌شود.

کلیدواژه‌ها


عنوان مقاله [English]

Comparison of two non-hierarchal clustering performance in vegetation community datasets

نویسندگان [English]

  • N. Pakgohar 1
  • J. Eshaghi Rad 2
  • Gh. gholami 3
  • A. Alijanpour 4
  • D. Roberts 5
1 Ph.D. of Forestry, Department of Forestry, Faculty of Natural Resources, Urmia University, Urmia, Iran
2 Corresponding author, Prof., Department of Forestry, Faculty of Natural Resources, Urmia University, Urmia, Iran
3 Assistant Prof., Department of Mathematics, Faculty of Science, Urmia University, Urmia, Iran
4 Associate Prof., Department of Forestry, Faculty of Natural Resources, Urmia University, Urmia, Iran
5 Prof., Department of Ecology, Montana State University, Bozeman, USA
چکیده [English]

     Clustering task is optimized and summarized high dimensional vegetation datasets that indicator of environmental change and gathering to interpreting pattern form ecosystem. Variety clustering methods is available and the issue is chosen proper methods. The aim of the research was compared two non-hierarchical clustering as K-means and K-medoids in forest ecosystems. For this purpose, two real datasets from Hyrcanian and Zagros forests of Iran and six simulated datasets were applied. The Hellinger transformation was employed before calculating dissimilarity matrices. Euclidean distance, Manhattan distance and Bray-Curtis dissimilarity indices were then calculated on the transformed data sets. And three evaluators including silhouette width, phi coefficient and ISAMIC were chosen. The results show that combination of Bray-Curtis dissimilarity matrices and K-means and K-medoids have first and second ranks among other clustering methods. K-means clustering is more effective in heterogenous dataset as Zagros and simulated datasets. The weakest clustering algorithm was combination between Manhattan distance and K-medoids. Also results show that Hellinger data transformation cause to improve Euclidean distance matrix. Our results indicated that combination of Bray-Curtis dissimilarity with K-means is more significant and recommended.