innovationterms

حكمة الجموع

إيضاح تحريري رسم يدوي لوزن عتيق في المعرض مع بطاقات تقدير مكتوبة يدويًا صغيرة، بطاقة واحدة مكتوب عليها 1207، على ورق دافئ مع حبر أزرق داكن ولون مطفأ.

إجابة سريعة

حكمة الجموع هي الظاهرة الإحصائية حيث تتفوق الأحكام المستقلة المجمع عليها على الخبراء - عندما تتحقق أربعة شروط.

حكمة الجموع: التعريف، الشروط، و عندما تفشل

حكمة الجموع هي الظاهرة الإحصائية حيث تتفوق الحكم المجمع المستقل لمجموعة متنوعة على الخبراء الأفراد في مهام التقدير والتنبؤ. النتيجة ليست سحرًا. تعتمد على أربعة شروط بنيوية (التنوع، الاستقلال، اللامركزية، والتجميع)، وتتلاشى عندما تدمر المنظمات بشكل عرضي الشروط التي تهم أكثر من أي شيء آخر: الاستقلال.

معظم منصات إدارة الأفكار في الشركات تفشل في هذا الأمر. تظهر عدد الأصوات، شارات الاتجاه، وتقييمات اللوائح في الوقت الفعلي، ثم تدعي أن الإخراج هو “حكمة الجموع”. الآلية التي تنشطها ليست تجميعًا؛ إنها تأثير اجتماعي. يقوم المتقدمون لاحقًا بالترابط مع الإشارات المبكرة بدلاً من تشكيل تقديرات مستقلة، وتلغي تنوع المجموعة نفسه.

ملخص

  • الظاهرة هي آلية إحصائية، ليس ادعاءًا بأن الجموع ذكية بشكل طبيعي.
  • يجب أن تحافظ أربعة شروط: تنوع الرأي، الاستقلال، اللامركزية، والتجميع.
  • الاستقلال هو السهل تدميره، وهو أكثر نقطة فشل شائعة في برامج الشركات.
  • عدد الأصوات المرئي وإشارات السلطة المبكرة تصنع إجماعًا يماثل حكمة الجموع.
  • أسواق التنبؤ تحافظ على الاستقلال من خلال تجميع إشارات الأسعار بدلاً من الأصوات المرئية.
  • الجموع تعمل بشكل أفضل على مشاكل الإدراك التي تحتوي على إجابات قابلة للقياس؛ تفشل في الأسئلة الإبداعية أو الجمالية أو الاستراتيجية دون حقائق ثابتة.
  • يجب على برامج الشركات جمع التقديرات العمياء أولاً، وكشف النتائج فقط بعد إغلاق التقديم، واختيار آليات التجميع التي تخفي المواقف الفردية.

الآلية ليست شعارًا ديمقراطيًا أو تبريرًا للتصويت المفتوح. إنها أداة إحصائية ضيقة ومحددة وهشة. الشركات التي تستفيد منها تصمم برامج تحمي الشروط التي تتطلبها.


ما جعل معرض مقاطعة أكثر ذكاءً من الخبراء؟

في عام 1906، تقدمت مجموعة مختلطة في معرض مقاطعة بتقدير أكثر دقة لوزن بقرة معدة من الخبراء في الماشية الحاضرة. كان متوسط التخمين 1,207 رطل، وكان الوزن الفعلي 1,198 رطل. فرانسيس غالتون، الذي نظم التحليل، كان يتوقع فشل المجموعة.

في عام 1906، تقدمت مجموعة مختلطة من المزارعين والبلدات في معرض West of England Fat Stock and Poultry Exhibition بتقدير أكثر دقة لوزن بقرة معدة من الخبراء في الماشية الحاضرة. وكان متوسط التخمين 1,207 رطل؛ وكان الوزن الفعلي للمعدة 1,198 رطل — خطأ أقل من 1 في المائة فرانسيس غالتون (1907).

تجربة غالتون العرضية

فرانسيس غالتون، الإحصائي الذي نظم التحليل، كان يتوقع فشل المجموعة. أراد إظهار أن الحكم الشعبي غير موثوق به. بدلاً من ذلك، أنتجت 787 إدخالًا صالحًا، بعد أن استبعد غالتون 13 بطاقة معيبة، تقديرًا جماعيًا كان تقريبًا دقيقًا تمامًا رسالة غالتون في Nature. إعادة تحليل حديثة من قبل كينيث واليس (2014) وجدت أخطاء صغيرة في أرقام غالتون المنشورة: كان الوزن الفعلي للمعدة أقرب إلى 1,197 رطل، وكان المتوسط الفعلي أقرب إلى 1,208 رطل، مع متوسط 1,197 رطل. النتيجة الأساسية لم تتغير تجربة وزن البقر.

عملت المجموعة لأن غالتون قد أنشأ بشكل عرضي الشروط لحكمة الجموع. كان المشاركون متنوعين معرفيًا — جزارون ومزارعون وبلدات مع نماذج عقلية مختلفة للماشية. قدموا تقديرات مستقلة، على بطاقات مطبوعة، دون رؤية تخمينات الآخرين. لم تفلتر أي سلطة مركزية المدخلات. وجمع غالتون النتائج باستخدام متوسط بسيط فرانسيس غالتون (1907).

وفقًا للمبدأ الديمقراطي “صوت واحد قيمة واحدة”، يعبر التقدير الأوسط عن vox populi، حيث يُدان كل تقدير آخر بأنه منخفض أو مرتفع جدًا من قبل أغلبية الناخبين.

فرانسيس غالتون، “Vox Populi”، Nature (1907)

فوجئ غالتون نفسه هو جزء من الأدلة. كتب أن النتيجة كانت “أكثر جدارة بالثقة في حكم ديمقراطي مما كان متوقعًا” رسالة غالتون في Nature. ليس معرض وزن البقر قصة رمزية عن نبالة الناس العاديين. إنه نقطة بيانات حول ما يحدث عندما تلغي الأخطاء المستقلة المتعددة بعضها البعض.

خطأ أقل من 1%: كان متوسط تخمين المجموعة 1,207 رطل، حيث أخطأ الوزن الفعلي للمعدة بنسبة 0.8 في المائة، مما يظهر كيف تلغي الأخطاء المستقلة في التجميع — فرانسيس غالتون، “Vox Populi”، Nature (1907).

ما هي حكمة الجموع؟

يصف هذا المفهوم كيفية تفوق الحكم المجمع لمجموعة من الأفراد المستقلين، المتنوعين معرفيًا، بشكل consistent على الحكم الخبرائي الفردي في مهام التقدير والتنبؤ وبعض مهام اتخاذ القرار Surowiecki (2004). بدلاً من الادعاء بأن الجموع أكثر حكمة من الأفراد بشكل عام، فإنها تدعي أن تحت شروط معينة، تلغي أخطاء الأفراد في التجميع، مما يجلب تقدير المجموعة أقرب إلى الحقيقة من معظم التخمينات الفردية.

آلية إلغاء الأخطاء

الآلية إحصائية. تتوزع الحكم الفردية حول القيمة الحقيقية مع أخطاء تقريبًا عشوائية. عندما تكون هذه الأخطاء مستقلة (غير متعلقة بإشارات مشتركة أو ضغط اجتماعي)، تلغي التقديرات الزائدة والتقديرات الناقصة بعضها البعض. يتقارب المجموع على الحقيقة بشكل أكثر موثوقية من أي مساهم فردي BizBasics / Darden School.

يحدد نظرية التنبؤ التنوع لسكوت باج هذه الفرضية: خطأ المجموعة يساوي متوسط خطأ الفرد أقل تنوع التنبؤ. تكون المجموعة أكثر دقة جماعيًا حتى لو كان أفرادها أقل خبرة من المتخصص Page (2007). التنوع ليس ميزة جانبية. إنه المتغير operativo.

المجموعات فقط ذكية عندما يكون الأشخاص فيها مستقلين قدر الإمكان. هذا هو تناقض حكمة الجموع، أو تناقض الذكاء الجماعي، أنه ما يتطلبه في الواقع هو شكل من أشكال التفكير المستقل.

جيمس سورويكسكي، محاضرة مؤتمرة

ما هي حكمة الجموع ليست

ليس ديمقراطية، حتى لو كانت مجموعة متضمنة. لم يعد غالتون الأصوات؛ استخدم المتوسط. ليس brainstorming، وهو طريقة لجمع الأفكار، وليس طريقة لتوسط التخمينات. وليس مشاركة. يمكن أن تكون المنصة مليئة بالتعليقات والاعجابات وتدمير ما تدعي قياسه. في الواقع، كلما زادت حيوية المنصة، زادت احتمالية فشلها.

الاسم أيضًا لا يعني أن الخبراء غير مفيدين. الخبراء يظلون قيمين عندما تكون المعلومات الخاصة نادرة، عندما يتطلب المشكلة سببًا سببيًا متخصصًا، أو عندما تفتقر المجموعة إلى التنوع الأدنى الذي يجعل عمل إلغاء الأخطاء يعمل. الادعاء narrower مما يبدو عليه: للتقدير والتنبؤ المهام مع المدخلات المستقلة المتنوعة، يتفوق المجموع على متوسط الخبير.

ما هي الشروط الأربعة لعمل حكمة الجموع؟

دقة المجموعة ليست خاصية داخلية للمجموعات الكبيرة. إنها خاصية شرطية تتطلب أربعة شروط بنيوية. جيمس سورويكسكي سمىهم تنوع الرأي، الاستقلال، اللامركزية، والتجميع حكمة الجموع.

التنوع يعني أن المجموعة لا يجب أن تكون جميعها من نفس نوع الشخص. كان لدى غالتون جزارين ومزارعين وبلدات؛ لم يكن لديه ثمانية جزارين. الاستقلال يعني أن كل تخمين يتم تشكيله قبل أن يرى الآخرين. إظهار عدد الأصوات يعني أنك قد كسرته بالفعل. اللامركزية تعني أن لا أحد يحصل على الموافقة المسبقة على المدخلات. التجميع هو مجرد الرياضيات التي تقوم بها في النهاية — متوسط غالتون لـ 787 إدخال، سعر تسوية سوق التنبؤ، أو متوسط درجة منصة التقديم العمياء استخراج قانون نيويورك. الثلاثة الأولى حول كيفية جمع التخمينات؛ الأخير هو ما تفعل به.

حالة الاختبار Iowa Electronic Markets

Iowa Electronic Markets (IEM) هي حالة اختبار مستمرة لجميع الشروط الأربعة التي تعمل في نفس الوقت. منذ عام 1988، تدير جامعة آيووا IEM، مما يتيح للمتداولين شراء وبيع العقود على نتائج الانتخابات. تجمع الأسعار المعلومات الموزعة دون كشفه مواقف المتداولين الفردية. عبر 964 استطلاعات رأي وخمس انتخابات رئاسية من 1988 إلى 2004، كان السوق أقرب إلى النتيجة النهائية من استطلاعات الرأي المهنية 74 في المائة من الوقت Berg, Nelson & Rietz (2008). في أسواق حصة التصويت، كانت التنبؤات في ليلة الانتخابات متوسط خطأ مطلق 1.34 في المائة Cambridge Core / PS:PSP (2026).

المتانة مهمة: الآلية لا تعتمد على دورة انتخابية واحدة أو مجموعة ضيقة من المشاركين.

لماذا الشروط ليست متساوية الهشاشة

بينما لا يمكنك بسهولة تدمير التنوع بالصدفة — خاصة وأن المنظمات عادةً ما تعترف عندما تكون جموعها متجانسة — الاستقلال هش، يتم تدميره بشيء بسيط مثل إظهار عدد الأصوات في الوقت الفعلي. من ناحية أخرى، الحفاظ على اللامركزية والتجميع يصبح واضحًا بمجرد أن يفهم مدير البرنامج ما يعنيه. هذه التفاوت الأساسي هو الذي يشرح لماذا تفشل معظم برامج الجموع في الشركات في الاستقلال، وليس في الشروط الثلاثة الأخرى.

لماذا الاستقلال هو أصعب شرط للحفاظ عليه؟

الاستقلال يتطلب من كل مشارك تشكيل تقدير قبل رؤية تخمين أي شخص آخر. إنه هش داخل المنظمات لأن التصنيفات، والموافقة، والمديح يجعلون المعلومات الاجتماعية مرئية. بمجرد أن يربط الناس على إجماع مرئي، تتوقف أخطاؤهم عن إلغاء بعضها البعض جيمس سورويكسكي.

الاستقلال يعني أنك تخمن قبل أن تنظر إلى ورقة جارك. هذا كل ما يعنيه. ولكن من المستحيل تقريبًا الحفاظ عليه داخل شركة، لأن الشركات آلات لجعل المعلومات الاجتماعية مرئية. التصنيفات، والموافقة، والمديح في الممرات — كل ذلك مفيد في الحياة العادية، وكل ذلك يسمر هذا الآلية الخاصة محادثة سورويكسكي في المؤتمر.

تجربة لورينز

كمم لورينز وآخرون. (2011) التكلفة. في تجربة مضبوطة مع 144 مشاركًا عبر 12 جلسات، تقدمت المشاركين بتقديرات حول الحقائق الجغرافية إحصاءات الجريمة عبر خمس جولات متتالية. تلقى بعض المشاركين ردود فعل اجتماعية حول تقديرات الآخرين قبل تقديم تقديراتهم الخاصة. النتيجة كانت ثلاثة تأثيرات سميت. تأثير التأثير الاجتماعي قلل من تنوع المجموعة دون تحسين خطأها الجماعي. تأثير تقليل النطاق دفع الإجابة الصحيحة إلى حدود نطاق التقدير. تأثير الثقة رفع ثقة المشاركين مع تأخر الدقة وراء الكسب لورينز وآخرون. (2011).

نظهر من خلال الأدلة التجريبية (N = 144) أن حتى التأثير الاجتماعي الخفيف يمكن أن يضر بآثار حكمة الجموع في مهام التقدير البسيطة.

لورينز وآخرون.، “كيف يمكن أن يضر التأثير الاجتماعي بآثار حكمة الجموع”، PNAS (2011)

الauthors يوضحون بشكل صريح أن نتائجهم تضر بالشرط الاستقلال المطلوب لحكمة الجموع دراسة التأثير الاجتماعي في PNAS. لم تدرس تجربتهم الضغط من الأقران أو تماسك المجموعة. درسوا ما يحدث عندما يرى الناس إشارات اجتماعية متجمعة قبل التزامهم بتقديرهم الخاص — exactly feature built into most enterprise idea management platforms.

ما يدمر الاستقلال في الممارسة

تعمل إحصاءات الأصوات المرئية، وتقييمات الشعبية، وتسميات الاتجاه، وموافقة التنفيذيين جميعها كإشارات اجتماعية. تتيح للمشاركين التمسك بالإجماع المرئي بدلاً من التفكير الخاص. بمجرد حدوث ذلك، تتوقف الأخطاء عن كونها مستقلة وتصبح متعلقة. لا تلغي التقديرات الزائدة والتقديرات الناقصة بعضها البعض anymore لورينز وزملاؤه.

أبحاث التحيز السلطةية تظهر أن الناس أكثر ميلاً للثقة والموافقة على المعلومات من الشخصيات السلطةية المزعومة، حتى عندما تكون المعلومات غير دقيقة المفوض الاجتماعي. independence لا يعيش مع الرؤية الاجتماعية. نفس الديناميكية تتوسع إلى بيئات الشركات عندما يحل شخصيات السلطة أو التصنيفات المرئية محل المتآمرين.

كيف تدمر منصات الشركات بشكل عرضي الشروط التي تهم

تجمع منصات إدارة الأفكار في الشركات التي تظهر عدد الأصوات الحية، شارات الاتجاه، أو اللوائح قبل إغلاق التصويت تصنع إجماعًا بدلاً من تجميع الحكمة. يقوم المتقدمون لاحقًا بالترابط مع الإشارات المبكرة بدلاً من تشكيل تقديرات مستقلة، مما يؤدي إلى انهيار تنوع المجموعة.

تجمع منصات إدارة الأفكار في الشركات التي تظهر عدد الأصوات قبل إغلاق التصويت لا تجمع الحكمة — تصنع إجماعًا يماثلها. الآلية هي بالضبط ما وثقه لورينز (2011) وموشنيك (2013) في المختبر: الإشارات الاجتماعية المبكرة تلغي التنوع، وتزيد الثقة في الإجماع الناشئ، وتدهور الدقة.

مشكلة عدد الأصوات الحية

عندما تظهر منصة إدارة الأفكار إحصاءات الأصوات في الوقت الفعلي، لا يقوم المتقدمون لاحقًا بتشكيل تقديرات مستقلة لجوالة الفكرة. يربطون الإشارات المرئية. ينهار تنوع المجموعة ليس لأن المشاركين يتفقون، بل لأنهم يتوافقون لورينز وآخرون. (2011).

أجرى موشنيك وآخرون. (2013) تجربة عشوائية على نطاق واسع على موقع تجميع الأخبار الاجتماعي. تلقى العناصر التي تم تعيينها بشكل عشوائي تصويتًا إيجابيًا مبكرًا تقييمات نهائية أعلى بنسبة 25 في المائة في المتوسط، بالكامل من خلال التأثير الاجتماعي. زاد التأثير الاجتماعي الإيجابي من احتمالية التقييمات الإيجابية بنسبة 32 في المائة موشنيك وآخرون. (2013). تعمل الآلية نفسها على منصات إدارة الأفكار في الشركات: يتدفق سلوك المتقدمين مبكرًا إلى النتيجة.

زاد التأثير الاجتماعي الإيجابي من احتمالية التقييمات الإيجابية بنسبة 32% وخلق تجميعًا إيجابيًا متزايدًا زاد التقييمات النهائية بنسبة 25% في المتوسط.

موشنيك وآخرون.، “تحيز التأثير الاجتماعي: تجربة عشوائية”، Science (2013)

+32% من احتمالية التقييم الإيجابي: زاد التأثير الاجتماعي الإيجابي المبكر من احتمالية التقييم الإيجابي بنسبة 32 في المائة وخلق تجميعًا متزايدًا رفع التقييمات النهائية بنسبة 25 في المائة في المتوسط — موشنيك وآخرون.، Science (2013).

المتغير HiPPO

المتغير HiPPO ضار من خلال نفس الآلية. حتى بدون إحصاءات الأصوات المرئية، إذا دعم قائد كبير فكرة علنًا قبل إغلاق التصويت، فإن إشارة السلطة تعمل كمرجع اجتماعي. هذا ليس مشكلة ثقافية. هذا هو تدمير ميكانيكي للشرط الاستقلال. رأي الشخص الأعلى أجرًا يصبح الأولي الذي يتجه الجميع نحوه فيديو التحيز السلطة.

ما يبدو عليه الإجماع المصنوع

من الخارج، يبدو أن الفكرة الأكثر تصويتًا في منصة تصويت مرئية هي اختيار المجموعة. ليس كذلك. إنها الفكرة التي اكتسبت زخمًا مرئيًا مبكرًا. النتيجة تبدو مثل حكمة الجموع؛ إنها إجماع مصنوع. قد تزداد مؤشرات مشاركة المنصة بينما تنهار دقتها. الشركات التي تدير هذه البرامج غالبًا ما تقارير مشاركة عالية ثم تتساءل لماذا تفشل الأفكار الفائزة في downstream.

الشركات التي إصلاحت هذا المشكلة بشكل منهجي تظهر التكلفة في العكس. استطلعت كوغيل وزيتزويتز (2014) أسواق التنبؤ الشركات في جوجل وفورد — كلاهما استبدل عمليات التنبؤ التقليدية بتجميع إشارات الأسعار العمياء والمخفية. أسواق جوجل الداخلية تفوقت على التنبؤات الخبرائية بنسبة 0.727× خطأ متوسط مربع؛ أسواق فورد بنسبة 0.742× كوغيل & زيتزويتز (2014). الأساس الذي هزموه كان التنبؤ الشركات التقليدي، حيث تشكل الإشارات الاجتماعية من الزملاء، والمدراء، والتوقعات السابقة التقديرات قبل التقديم. لم ينشر أي دراسة كبيرة على منصة أفكار الشركات دراسة سلبية مباشرة بعد الوفاة، ولكن الأدلة العكسية واضحة: إزالة التأثير الاجتماعي المرئي من نافذة التجميع تحسن الدقة بشكل قابل للقياس.

يبدو اللوحية صحية. أكثر الناس تصويتًا، أكثر الناس تعليقًا، أكثر الناس عادوا. المؤشر الوحيد الذي لا يظهر على اللوحية هو المؤشر الذي يهم: ما إذا كانت التخمينات لا تزال مستقلة. بمجرد فقدانها، لا تقوم المجموعة بأي شيء ذكي. إنها مجرد غرفة حيث الشخص الأول الذي يتكلم بصوت عالٍ يتم تكراره.

ما هي الطرق الأربعة التي تفشل فيها حكمة الجموع؟

تفشل حكمة الجموع بأربع طرق مميزة: تسرب المعلومات، التأثير الاجتماعي أو التجميع، التوحيد، وتأثير HiPPO. كل فشل يدمر شرطًا مختلفًا، والعلاج يعتمد على أي منها لديك.

الطرق الأربعة للفشل ليست نكهات نفس الخطأ. هم أخطاء مختلفة مع حلول مختلفة. التسرب هو ما يحدث عندما ينظر الناس إلى الطابور أمامهم ويقررون أن معلوماتهم الخاصة ليست ذات قيمة كبيرة. التجميع هو ما يحدث عندما يريدون فقط الوقوف مع المجموعة. التوحيد هو ما يحدث عندما الجميع في الغرفةThink بالفعل نفس الشيء. وتأثير HiPPO هو ما يحدث عندما يختار boss أولاً. كل واحد منهم يكسر الآلية، ولكن العلاج يعتمد على أي واحد لديك.

التسرب مقابل التجميع

يتDifference تسرب المعلومات عن التأثير الاجتماعي في طريقة مهمة. التسرب هو عقلاني: بعد مراقبة عدد كافٍ من الاختيارات السابقة المتتالية، يصبح الإشارة الخاصة بالمشارك إحصائيًا غير ذات أهمية، والالتزام بالترتيب المرئي هو الخطوة bayesian الصحيحة Bikhchandani, Hirshleifer & Welch (1992). التجميع هو نفسي: المشارك يتوافق لتجنب الوقوف على حدة دراسة التأثير الاجتماعي في PNAS. تتداخل التدخلات (إخفاء الإشارات المبكرة)، ولكن التشخيص مهم لمديري البرامج الذين يريدون شرح الفشل للجهات الفاعلة.

بالأرقام: الأدلة على دقة الجموع (وحدودها)

تظهر الأدلة الكمية على مدى 120 عامًا أن تجميع الجموع يعمل عندما يحافظ على الاستقلال ويتراجع عندما يدخل التأثير الاجتماعي. تجربة غالتون مع البقر، أسواق آيووا الإلكترونية، أسواق التنبؤ في HP، وتجربة لورينز تجعل الحالة ملموسة.

تغطي الأدلة على دقة الجموع 120 عامًا ومجالات متعددة. الأدلة على هشاشتها تحت التأثير الاجتماعي متكافئة بشكل مماثل.

الأدلةالنتيجةالمصدر
تجربة غالتون مع البقر، 1906متوسط التخمين 1,207 رطل مقابل الوزن الفعلي 1,198 رطل؛ خطأ 0.8% تجربة وزن البقرغالتون، Nature (1907)
أسواق آيووا الإلكترونية، 1988–2004السوق أقرب إلى النتيجة من الاستطلاعات في 74% من 964 مقارنة رأسًا رأسًا دراسة مجلة التنبؤ الدوليةبيرغ، نيلسون & ريتز، Int. J. Forecasting (2008)
أسواق آيووا الإلكترونية، حصة التصويتمتوسط خطأ مطلق 1.34% في التنبؤات في ليلة الانتخابات في الانتخابات الرئاسية الأمريكية تحليل IEM 2024Cambridge Core / PS:PSP (2026)
أسواق آيووا الإلكترونية، 1988–2020تفوقت على الاستطلاعات في 74% من الانتخابات الرئاسية الأمريكية Prediction Today (2026)Prediction Today (2026)
تجربة تأثير لورينز الاجتماعييقلل التأثير الاجتماعي من تنوع التخمينات دون تحسين الدقة؛ تزداد الثقة رغم عدم زيادة الدقة لورينز وزملاؤهلورينز وآخرون.، PNAS (2011)
تحيز تأثير موشنيك الاجتماعيتصويت إيجابي مبكر → +25% في التقييمات النهائية؛ +32% من احتمالية التقييمات الإيجابية تجربة التجميع في Scienceموشنيك وآخرون.، Science (2013)
أسواق التنبؤ في HPتفوقت على التنبؤات الرسمية للمبيعات في 6 من 8 حالات؛ الاتجاه صحيح في جميع 8 الحالات تشين & بلوت (2002)تشين & بلوت، ورقة عمل Caltech (2002)
أسواق التنبؤ الشركاتخطأ متوسط مربع سوق جوجل 0.727× خطأ متوسط مربع الخبير؛ فورد 0.742× دراسة أسواق التنبؤ الشركات في بيركليكوغيل & زيتزويتز، بيركلي (2014)

74% من الانتخابات: كانت أسواق آيووا الإلكترونية أقرب إلى النتيجة من الاستطلاعات المهنية في 74 في المائة من 964 مقارنة رأسًا رأسًا من 1988 إلى 2004 — بيرغ، نيلسون & ريتز، Int. J. Forecasting (2008).

النمط الرئيسي

يمر الجدول اختبار العزل: القارئ الذي يرى فقط هذه القسم يحصل على الحالة العددية دون الحاجة إلى السرد. يعمل تجميع الجموع عندما تحافظ الشروط الأربعة، ويظهر الضرر القابل للقياس بمجرد أن يتم المساس بالاستقلال. الصفوف لورينز وموشنيك كمم التكلفة؛ الصفوف IEM، HP، وكوغيل كمم الربح من الحفاظ على الاستقلال.

أسواق التنبؤ في HP: ما تبدو عليه حكمة الجموع في الشركات عندما تعمل

عملت أسواق التنبؤ الداخلية في HP لأن تصميمها حفظ جميع الشروط الأربعة لسورويكسكي — بشكل خاص شرط الاستقلال الذي تدمره معظم برامج الشركات. الآلية كانت تجميع إشارات الأسعار، وليس عد الأصوات.

الإعداد

في منتصف التسعينيات، شركت مجموعة التنبؤ في HP مع تشارلز بلوت في Caltech لrunning أسواق داخلية لتنبؤات مبيعات المنتجات. من 20 إلى 30 موظفًا يتداولون العقود التي تعتمد ربحها على نتائج مبيعات الفعلية. استخدم السوق مزادًا مزدوجًا مستمرًا: تجميع الأسعار تقدير المجموعة دون أن يرى أي مشارك أصوات الآخرين ورقة عمل Caltech.

لضمان أن المشاركين لا يكون لديهم أي معرفة بأسماء بعضهم البعض أو النتائج المجمعة حتى نهاية التجربة، مما يحد من تأثيرات التأثير على قراراتهم التجارية، استند المشاركون فقط إلى معلوماتهم الشخصية، والمعلومات العامة المتاحة من HP، وأنماط التجارة التي رصدوها من المشاركين الآخرين عبر الإنترنت (بناءً على أرقام الهوية المجهولة).

تشين & بلوت، “آليات تجميع المعلومات”، ورقة عمل Caltech 1131 (2002)

قرارات التصميم

تتماشى قرارات التصميم بشكل نظيف مع الشروط الأربعة. الحفاظ على السرية يحافظ على الاستقلال. المشاركين من جميع أنحاء الشركة، وليس فقط فريق التنبؤ، يوفرون التنوع واللامركزية. مزاد مزدوج مستمر يوفر تجميعًا عبر إشارات الأسعار بدلاً من عد الأصوات المرئي. والعقود تستقر ضد نتائج المبيعات الفعلية، مما يوفر حقائق خارجية دراسة أسواق التنبؤ في HP.

النتيجة

كانت النتائج متسقة مع الآلية. في ستة من ثمانية حالات قابلة للمقارنة، تفوقت سوق التنبؤ على التنبؤ الرسمي لمبيعات HP. أشار السوق بشكل صحيح إلى اتجاه الانحراف في جميع الثماني حالات تشين & بلوت (2002). هذا متسق مع نظرية التاجر الهامشي (المبدأ الذي يحدد دقة السوق من خلال مجموعة صغيرة من المتداولين الملمين، حيث تكون مواقفهم جيدة الترميز تدفع السعر المتوازن نحو الحقيقة، بغض النظر عن عدد المشاركين الأقل خبرة الذين يتداولون أيضًا) — مجموعة HP من 20 إلى 30 موظفًا لم تكن بحاجة إلى أن تكون خبيرًا موحدًا حتى يتقارب إشارة السعر على تنبؤات دقيقة.

لماذا تصميم HP هو الاستثناء، وليس الافتراضي

معظم منصات إدارة الأفكار في الشركات تفعل العكس. تظهر من voted for what، ترتب الأفكار حسب الشعبية، وتسمح بالتعليقات التي تكشف المواقف الفردية. كل ميزة مصممة للمشاركة. كل ميزة تدمر الاستقلال. تم تصميم أسواق HP للدقة أولاً. التضحية حقيقية: السرية والسعر المغلقة تنتج أقل حماس مرئيًا، ولكن تنتج تقديرات أفضل.

كيف تختلف حكمة الجموع عن التجميع الجماعي، وجمود المجموعة، وذكاء السرب؟

ثلاثة مصطلحات يتم الخلط بينها غالبًا هي في الواقع ثلاثة أشياء مختلفة: آلية جمع (التجميع الجماعي)، نتيجة قرار سيئة (جمود المجموعة)، وعملية التقارب الديناميكي (ذكاء السرب). الخلطات مهمة لأنها تؤدي إلى خيارات التصميم الخاطئة.

المصطلحما هوشرط الدقةما يدمرهImplications for enterprise design
حكمة الجموعآلية تجميع تحول التقديرات المستقلة المتنوعة إلى إجابة جماعيةتلغي الأخطاء المستقلةالتأثير الاجتماعي، التوحيد، المشاركة الرقيقةالتقييم العمياء، التجميع المتوسط أو السعر، لا رؤية وسطية لورينز وآخرون. (2011)
التجميع الجماعيآلية جمع مفتوحة التقديم التي تجمع المدخلات من مجموعة كبيرةيعتمد على ما يحدث بعد الجمعالخلط بين التجميع؛ الافتراض أن الجمع وحده ينتج دقةفصل النداء المفتوح عن طريقة التجميع Surowiecki (2004)
جمود المجموعةنتيجة قرار سيئة بسبب قمع الإجماع بسبب التماسكغير مناسب — هو تسمية فشل، ليس آليةتماسك عالٍ، عزل عن الإجماع، قيادة توجيهيةاستخدام الإجماع الهيكلي والتقييم المستقل قبل المناقشة Sunstein (2006)
ذكاء السربتقارب زمني ديناميكي حيث تحديث الوكلاء سلوكهم بناءً على إشارات الأقران المستمرةمفيد عندما يكون التكيف هو الهدف؛ ضار عندما يكون التجميع المستقل هو الهدفمعاملة التغذية الراجعة في الوقت الفعلي دائمًا كمنفعةاستخدامه لمشاكل التحسين والتوجيه، وليس لتقدير مستقل نظرية تسرب المعلومات

التجميع الجماعي ليس تجميعًا

يصف التجميع الجماعي كيفية جمع المدخلات. المفهوم يصف كيفية تجميعها. يمكن أن coexist (سوق تنبؤ مفتوح هو كلاهما) أو يكون fully decoupled — جلسة brainstorming مفتوحة هي تجميع جماعي بدون أي تجميع حكمة الجموع. الشركات تنفذ حملات نداء مفتوح وتتوقع دقة حكمة الجموع، ولكن النداءات المفتوحة هي آلية جمع، ليس آلية تجميع.

جمود المجموعة هو نتيجة، ليس آلية

جمود المجموعة هو نتيجة جودة القرار، ليس آلية. يصف مجموعة تصل إلى قرار سيئ لأن التماسك يقمع الإجماع. فشل تجميع الجموع هو آلية: تم تدمير الاستقلال، لذا انهار الدقة. الفرق مهم لأن التدخل مختلف. جمود المجموعة يتم معالجته من خلال كسر التماسك؛ فشل تجميع الجموع يتم معالجته من خلال استعادة الاستقلال Infotopia.

ذكاء السرب هو تقارب ديناميكي

ذكاء السرب هو تقارب زمني ديناميكي. الوكلاء يتحديثون بناءً على سلوك الأقران المستمر — مستعمرات النمل، تجميعات السمان، بعض خوارزميات التوجيه. حلقة التغذية الراجعة هي النقطة. الآلية تتطلب العكس: لا تغذية راجعة قبل التجميع. التقارب في الوقت الفعلي يدمر الاستقلال الذي يحتاجه تجميع الجموع ورقة Journal of Political Economy.

أي مشاكل يمكن أن حلها الجموع فعليًا؟

يقسم سورويكسكي المشاكل التي تواجه المجموعات إلى ثلاث فئات: مشاكل الإدراك، مشاكل التنسيق، ومشكلات التعاون استخراج قانون نيويورك. يتفوق تجميع الجموع على الخبراء بشكل موثوق فقط في مشاكل الإدراك — مهام التقدير والتنبؤ التي تحتوي على إجابة قابلة للتحقق. تتطلب مشاكل التنسيق والتعاون آليات مختلفة تمامًا.

مشاكل الإدراك تحتوي على حقائق ثابتة

تحتوي مشاكل الإدراك على حقائق ثابتة يمكن التحقق منها لاحقًا. وزن البقر كان 1,198 رطل. الفائز في الانتخابات معروف في النهاية. يتم الإبلاغ عن مبيعات المنتجات في النهاية. هذه التحقق بعد الحدث هي ما يجعل إلغاء الأخطاء معنيًا. بدونها، لا يوجد خطأ لإلغائه Lanier (2010). Researchers called this property demonstrability (how much a task carries a verifiable correct answer that can eventually be checked against reality) — high-demonstrability tasks are where crowd aggregation reliably outperforms expert judgment; low-demonstrability tasks, where no ground truth exists, produce only a central tendency of preferences.

أبحاث فيليب تيتلك حول الحكم السياسي الخبير تدعم الحدود. الخبراء متفائلون بشكل نظامي في التنبؤ السياسي، وتكاليفهم أسوأ من النماذج الإحصائية Tetlock (2005). تلغي الأخطاء المستقلة؛ تتضاعف الثقة الخبيرة. هذا التفاوت هو سبب تفوق الجموع على المتخصصين في مهام التقدير.

فخ القرار الاستراتيجي

“التجميع الجماعي” للقرارات الاستراتيجية هو عادةً مشكلة تعاون مرسومة كproblem cognition. طلب من سكان أوسع التصويت على أي رؤية المنتج يجب متابعتها لا ينتج تقديرًا دقيقًا لمستقبل التحقق من السوق. ينتج توزيع تفضيلات مشوهة بإشارات المرئية والسلطة. الآلية خاطئة لنوع المشكلة.

ما الذي يخطئ فيه الناس حول حكمة الجموع؟

أربعة مفاهيم خاطئة منتشرة بما يكفي لإنتاج برامج سيئة. كل منها يتم دحضه من قبل نفس قاعدة الأدلة التي تدعم الظاهرة.

”الحجم وحده ينتج حكمة”

خطأ. مجموعة كبيرة متجانسة معرضة لمعلومات اجتماعية أقل دقة من مجموعة صغيرة مستقلة. أظهر لورينز وآخرون. (2011) أن التأثير الاجتماعي قلل التنوع دون تحسين الدقة دراسة التأثير الاجتماعي في PNAS. المتغير operativo هو التنوع مضروبًا في الاستقلال، وليس عدد الأفراد. نظرية التنبؤ التنوع لبيج تؤكد أن التنوع، وليس الحجم، يحدد الدقة الجماعية The Difference.

مدير برنامج يضيف hundreds of participants but keeps visible voting is not increasing wisdom. They are increasing the sample size of a correlated signal. The errors no longer cancel; they reinforce.

”حكمة الجموع تعني أن الأغلبية على حق”

خطأ. استخدم غالتون المتوسط، وليس التصويت. حكم الأغلبية في مهام تقدير الواقعية تنتج اختيارًا للأغلبية، وليس إلغاء الأخطاء. الآلية التجميعية تحدد الدقة فرانسيس غالتون (1907). نظام يعد الأصوات ليس بالضرورة نظامًا يلغي الأخطاء.

الخلط طبيعي. كل آلية تتضمن العديد من الأشخاص وتنتج إخراجًا واحدًا. ولكن التصويت بالأغلبية يختار الخيار الأكثر شعبية. التجميع المتوسط يجد الاتجاه المركزي للتخمينات المستقلة. يجيبان عن أسئلة مختلفة ويحتاجان إلى شروط مختلفة.

”التجميع الجماعي هو حكمة الجموع”

خطأ. التجميع الجماعي هو آلية جمع. حكمة الجموع هي آلية تجميع. تشغيل جلسة brainstorming مفتوحة التقديم ليس مثل نشر تجميع الجموع. يمكن أن coexist، ولكن يمكن أيضًا أن يكون completely decoupled Surowiecki (2004).

جلسة brainstorming مفتوحة التقديم جيدة قد تولد مدخلات مفيدة ولكن لا تجميعًا دقيقًا. تصويت مرئي سيئ قد ينتج خيارًا شعبيًا يبدو مثل حكمة الجموع ولكن هو في الواقع إجماع مصنوع.

”الجموع يعرفون الأفضل عندما يشارك الجميع”

خطأ لمOST الاستراتيجيات. حدود الإدراك لسورويكسكي تظهر أن تجميع الجموع مقتصر على التقدير والتنبؤ. للمسائل الإبداعية أو الجمالية أو القيم، المشاركة الأوسع بدون استقلال هي conformity organized، ليس wisdom You Are Not a Gadget.

عندما تفشل حكمة الجموع حتى عندما تحافظ الشروط؟

حتى برنامج تجميع الجموع المصمم بشكل صحيح يفشل في أنواع معينة من المشاكل. الشروط ضرورية ولكن ليس كافية. يجب أن تحتوي المشكلة على حقائق ثابتة يمكن التحقق منها — بدونها، لا يوجد خطأ لإلغائه.

الحكم الإبداعي والجمالي

جارون لانيير يجادل بأن آلية إلغاء الأخطاء تتطلب حقائق ثابتة يمكن حساب الدقة منها في النهاية. المشاكل الإبداعية والجمالية — أي رؤية المنتج أقوى، أي استراتيجية لها أكبر إمكانيات طويلة الأمد — لا تحتوي على حقائق ثابتة. الآلية تنتج اتجاهًا مركزيًا للتفضيلات، وليس تقديرًا دقيقًا للحقيقة الأساسية نقد لانيير. حيث لا يوجد إجابة في النهاية، لا يوجد خطأ لإلغائه.

الأسواق الرقيقة

تتراجع دقة أسواق التنبؤ عندما تنخفض المشاركة دون عتبة الحد الأدنى. وثق رود & سترومف (2004) أن الأسواق الصغيرة التنبؤية تولد فوارق أسعار واسعة وتصبح قابلة للتلاعب. قاعدة إبهام تقريبية هي أن أقل من 20 تاجر نشط ينتج تجميعات غير موثوقة Rhode & Strumpf (2004).

مشكلة السوق الرقيقة سهلة تجاهلها في التجارب التجريبية للشركات. يبدأ مدير البرنامج سوق تنبؤًا مع 12 مشاركًا مدعوًا، يحصل على نتيجة نظيفة، ويعلن النجاح. البرنامج التالي يعمل مع 8 مشاركين وييدر. الحجم هو شرط من نفسه.

المناقشة بعد التجميع

أظهر كاس صنستاين أن المجموعات المناقشة غالبًا ما تؤدي إلى أداء أسوأ من التجميع الإحصائي للتخمينات الفردية. المناقشة introduces influence cascades التي كان التجميع سيلغيها. حتى عندما تحافظ الشروط nominally عند نقطة الجمع، يمكن أن يدمر المناقشة بعد التقديم الاستقلال بعد fact البحث في المناقشة مقابل التجميع.

كيف تصمم برنامجًا للشركات لا يدمر حكمة الجموع بشكل عرضي؟

أربع قرارات تصميم تحافظ بشكل موثوق على الشروط الأربعة. لا تتطلب أي منها تكنولوجيا باهظة الثمن. ثلاثة تتطلب مقاومة خيارات واجهة المستخدم الافتراضية التي تجعل منصات إدارة الأفكار التي تركز على المشاركة.

الجولة الأولى العمياء

جمع جميع التقييمات قبل الكشف عن أي نتائج. هذا هو التدخل المباشر الذي يشير إليه لورينز وآخرون. (2011): التأثير الاجتماعي يدهور الدقة عندما يسبق الالتزام، لذا إزل الإشارة الاجتماعية من نافذة الالتزام لورينز وزملاؤه. تصميم تسلسل “الجولة الأولى العمياء، الكشف في الجولة الثانية” يستعيد الاستقلال جزئيًا مقارنة بالVisibility المستمرة.

التنوع الهيكلي

جذب المشاركين الذين لديهم خلفيات مجالية مختلفة، أدوار تنظيمية، ومدة خدمة. لا تقتصر تقييم الأفكار على الفريق الأقرب إلى المشكلة. نظرية التنبؤ التنوع لبيج تظهر أن مجموعة أكثر تنوعًا أكثر دقة جماعيًا حتى لو كان أفرادها أقل خبرة نظرية التنبؤ التنوع.

وجد وولي وآخرون. (2010) أن عامل الذكاء الجماعي للمجموعات يتنبأ بالمشاركة المتساوية وحساسية اجتماعية — ليس بالذكاء الفردي أو تماسك المجموعة Woolley et al. (2010). التقييم العمياء يضمن المشاركة المتساوية من خلال منع بعض الأسماء العليا من dominance signal قبل تقديم الآخرين.

اختيار آلية التجميع المناسبة

تجميع إشارات الأسعار عبر أسواق التنبؤ أو التقييم العمياء مع تجميع متوسط أكثر دقة من التصويت المفتوح مع العد المرئي. الاختيار يعتمد على ما إذا كان البرنامج يحتاج إلى تقديرات نقطة أو ترتيبات Wolfers & Zitzewitz (2004). استخدم أسواق HP مزادات مزدوجة مستمرة لأن التنبؤ بمبيعات المنتجات يحتاج إلى تقديرات نقطة ورقة عمل Caltech.

كشوف النتائج فقط بعد إغلاق التقديم

لا يجب أن يرى أي مشارك كيف قيم الآخرين فكرة بينما تقييمه لا يزال مفتوحًا. هذا ينطبق على إحصاءات الأصوات، التعليقات، لوحات القيادة، وموافقة القادة التنفيذيين. الكشف بعد التجميع جيد ويمكن أن يdrive learning without destroying the accuracy of the collected round.

مقارنة تصميم الأسلوب

قبل اختيار تصميم المنصة، اسأل ما هو الهدف الذي يخدمه البرنامج بالفعل:

تصميم التقييم العمياء (الهدف: الدقة)

  • جميع التقييمات يتم جمعها قبل عرض أي نتائج
  • إحصاءات الأصوات، تسميات الاتجاه، ولوحات القيادة مخفية خلال نافذة الجمع
  • التجميع: متوسط درجة، ترتيبات عمياء، أو إشارة سعر
  • إدخال القائد التنفيذي مقبول ولكن غير مسمى أو منسوب حتى بعد إغلاق التقديم
  • مؤشر النجاح: معدل التنفيذ downstream لأفضل الأفكار مرتبة

تصميم التصويت المرئي (الهدف: الموافقة والموافقة)

  • إحصاءات الأصوات والترتيبات تعرض في الوقت الفعلي خلال الجمع
  • التعليقات، التفاعلات، والموافقة مرئية لجميع المشاركين
  • التجميع: ترتيبات شعبية أو عدد الأصوات
  • موافقة القادة التنفيذيين مرئية ومنسوبة أثناء التصويت
  • مؤشر النجاح: معدل المشاركة، المشاركة، وحجم التعليقات

التصميمين ليسا بدائل. المنظمات التي تدير برامج تصويت مرئية وتبلغ الإخراج باسم “حكمة الجموع” لا تحصل على أي منهما: الدقة التجميعية العمياء أو الموافقة الحقيقية التي تأتي من عملية يثق بها الأطراف الفاعلة. قاعدة قرار لمديري البرامج: إذا كان هدف البرنامج هو دقة جودة الأفكار، استخدم التقييم العمياء والكشف التسلسلي. إذا كان الهدف هو الموافقة، فإن التصويت المرئي مناسب — ولكن كن صريحًا بأن الإخراج هو توزيع تفضيلات، ليس تقدير دقة (لورينز وآخرون. (2011); دراسة أسواق التنبؤ في HP).

أسئلة متكررة

مفاهيم أساسية

ما هي حكمة الجموع؟

حكمة الجموع هي الظاهرة الإحصائية حيث يتفوق الحكم المجمع المستقل لمجموعة متنوعة على الخبراء الأفراد في مهام التقدير والتنبؤ. تتطلب التنوع، الاستقلال، اللامركزية، والتجميع حكمة الجموع.

ما هي الشروط الأربعة لعمل حكمة الجموع؟

تنوع الرأي، الاستقلال، اللامركزية، والتجميع — كل منها يعالج نقطة فشل مختلفة. التنوع يضمن أن النماذج العقلية ومصادر المعلومات الفردية تختلف، لذا لا تكون الأخطاء متحيزة بشكل نظامي في نفس الاتجاه. الاستقلال يمنع التأثير الاجتماعي من ارتباط تلك الأخطاء قبل أن تلغي بعضها البعض. اللامركزية تضمن عدم وجود سلطة مركزية تفلتر أو ترتب المدخلات مسبقًا. التجميع هو الآلية التي تحول المدخلات المستقلة إلى إجابة جماعية — متوسط غالتون، سعر سوق التنبؤ، أو متوسط التقديم العمياء استخراج قانون نيويورك.

modes of failure

ما الفرق بين حكمة الجموع وجمود المجموعة؟

فشل تجميع الجموع هو آلية: تم تدمير الاستقلال، لذا انهار الدقة. جمود المجموعة هو نتيجة قرار سيئة بسبب قمع الإجماع بسبب التماسك. التدخلات مختلفة: واحد يستعيد الاستقلال، الآخر يكسر التماسك Sunstein (2006).

عندما تفشل حكمة الجموع؟

تفشل عندما يتم تدمير الاستقلال من خلال الأصوات المرئية أو إشارات السلطة دراسة التأثير الاجتماعي في PNAS، عندما تكون المجموعة متجانسة Page (2007)، عندما لا تحتوي المشكلة على حقائق ثابتة يمكن التحقق منها Lanier (2010)، أو عندما يكون السوقToo fragmented to average out individual errors دراسة أسواق الرهان التاريخية.

Differences

ما الفرق بين التجميع الجماعي وحكمة الجموع؟

التجميع الجماعي هو آلية جمع. حكمة الجموع هي آلية تجميع. سوق تنبؤ مفتوح يفعل كلاهما. جلسة brainstorming مفتوحة تفعل فقط الأولى Surowiecki (2004).

كيف تستخدم أسواق التنبؤ حكمة الجموع؟

تجمع أسواق التنبؤ التقديرات المستقلة عبر إشارات الأسعار. لا يرى المتداولون هويات بعضهم البعض أو المواقف الفردية؛ يرون فقط سعر السوق. أسواق HP الداخلية تفوقت على التنبؤات الرسمية للمبيعات في ستة من ثمانية حالات باستخدام هذا التصميم تشين & بلوت (2002).

Implementation

هل يمكن أن تعمل حكمة الجموع داخل شركة لها هرمية؟

نعم، إذا لم تبث الهرمية إشارات السلطة قبل إغلاق التقديم. يحافظ التقييم العمياء والتنوع الهيكلي على دقة الجموع حتى في المنظمات الهرمية إدارة الابتكار. الهرمية فقط تدمر الدقة عندما تكون موافقة كبار المسؤولين مرئية خلال نافذة التقييم (لورينز وزملاؤه; موشنيك وزملاؤه).


كلارا avatar

مؤلف

كلارا @cla_reinholt

تتركز على التواصل الإبداعي، والتسهيل، وتحويل الإطارات إلى عادات الفريق.

تكتب كلارا حول الأنظمة البشرية وراء الإبداع: جودة التسهيل، وضوح التواصل، والروتينات التي تساعد الفرق على الانتقال من الأفكار إلى القرارات. تتبع مصادر عملية الفريق العملي مثل دليل فريق أتلاسيان، بالإضافة إلى تغطية الإبداع من مckينسي وهارفارد بزنس ريفيو.

تجمع مساهماتها often بين القصص التحريرية والوصفات العملية التي يمكن للملئديات إعادة استخدامها للاحتفالات الفريق، والانعكاسات، ومراجعات الميزانية، مستندة إلى البحوث والpraсtices من مكينيزي على الإبداع, هارفارد بزنس ريفيو, ودليل فريق أتلاسيان.

تسأل كلارا سؤالًا متكررًا في مسوداتها: سيساعد هذا أحدهم على قيادة حوار أفضل غدًا؟ إذا كانت الإجابة نعم، فإن المقال جاهز.