الفرق بين التراتبية الهرمية والتقسيم الجزئي

Anonim

التسلسل الهرمي مقابل التجميع الجزئي

التجميع عبارة عن تقنية تعلم آلي لتحليل البيانات وتقسيمها إلى مجموعات من البيانات المتشابهة. وتعرف هذه المجموعات أو مجموعات من البيانات المماثلة بالتكتلات. يبحث تحليل الكتلة في خوارزميات التجميع التي يمكنها تحديد المجموعات تلقائيا. الهرمية والجزءية هما فئتان من خوارزميات التجميع. تخترق خوارزميات التجميع الهرمي البيانات في التسلسل الهرمي للمجموعات. تقسم الخوارزميات التقييدية مجموعة البيانات إلى أقسام منفصلة بشكل متبادل.

ما هو التسلسل الهرمي؟

تكرر خوارزميات التجميع الهرمي دورة إما دمج المجموعات الأصغر حجما إلى مجموعات أكبر أو تقسيم المجموعات الأكبر حجما إلى مجموعات أصغر حجما. في كلتا الحالتين، فإنه ينتج التسلسل الهرمي من مجموعات تسمى رسم تخطيطي. وتستخدم إستراتيجية التكتل التجميعي النهج من أسفل إلى أعلى لدمج المجموعات في مجموعات أكبر، في حين تستخدم استراتيجية التجميع الانقسام النهج من الأعلى إلى الأسفل لتقسيمها إلى نهج أصغر. عادة، يتم استخدام النهج الجشع في تحديد أي مجموعات أكبر / أصغر تستخدم لدمج / تقسيم. المسافة الإقليدية، مسافة مانهاتن وتشابه جيب التمام هي بعض المقاييس الأكثر شيوعا للتشابه للبيانات الرقمية. بالنسبة إلى البيانات غير الرقمية، يتم استخدام مقاييس مثل مسافة هامنج. ومن المهم أن نلاحظ أن الملاحظات الفعلية (الحالات) ليست مطلوبة للتكتل الهرمي، لأن مصفوفة المسافات فقط كافية. رسم تمثيلي هو تمثيل مرئي للمجموعات، والذي يعرض التسلسل الهرمي بشكل واضح جدا. يمكن للمستخدم الحصول على مجموعات مختلفة اعتمادا على المستوى الذي يتم قطع الرسم البياني.

ما هو التقسيم الجزئي؟

تقوم خوارزميات التجميع الجزئي بإنشاء أقسام مختلفة ومن ثم تقييمها بواسطة بعض المعايير. كما يشار إلى أنها غير الهرمية كما يتم وضع كل مثيل في بالضبط واحدة من k مجموعات متبادلة. ونظرا لأن مجموعة واحدة فقط من المجموعات هي خرج خوارزمية تجميعية نموذجية، يتعين على المستخدم إدخال العدد المطلوب من المجموعات (التي تسمى عادة k). واحدة من خوارزميات التجميع التقسيمية الأكثر شيوعا هي خوارزمية تجميع k-مينز. المستخدم مطلوب لتوفير عدد من المجموعات (ك) قبل البدء والخوارزمية تبدأ أولا مراكز (أو سينترويدس) من أقسام k. باختصار، k- يعني خوارزمية تجميع ثم تعيين أعضاء على أساس المراكز الحالية وإعادة تقييم مراكز على أساس الأعضاء الحاليين. وتكرر هاتان الخطوتان إلى أن يتم تحسين وظيفة هدف تشابه بين الكتلة وبين وظيفة هدف الاختلاف بين المجموعات.ولذلك، فإن التهيئة المعقولة للمراكز عامل مهم جدا في الحصول على نتائج نوعية من خوارزميات تجميع جزئية.

ما هو الفرق بين التسلسل الهرمي والتقسيم الجزئي؟

التجمعات الهرمية والتقسيم لها اختلافات رئيسية في وقت التشغيل، والافتراضات، ومعلمات المدخلات والمجموعات الناتجة. وعادة ما تكون المجموعات الجزئية أسرع من التكتلات الهرمية. ولا يتطلب التكتل الهرمي سوى إجراء تشابه، في حين تتطلب المجموعات الجزئية فرضيات أقوى مثل عدد المجموعات والمراكز الأولية. ولا يتطلب التكتل الهرمي أي معلمات للإدخال، بينما تتطلب خوارزميات التجميع الجزئي عدد المجموعات للبدء في التشغيل. وتؤدي التكتلات الهرمية إلى تقسيم أكثر وضوحا وذاتية للمجموعات، إلا أن التكتلات المقسمة تؤدي إلى مجموعات من الكتل بالضبط. وتكون خوارزميات التجميع الهرمي أكثر ملاءمة للبيانات الفئوية طالما أن قياس التشابه يمكن تعريفه وفقا لذلك.