اگر از يك فهرست اعداد، مثلا جمعيت شهرهاي يك كشور يا شمارهي شناسنامه آدمهاي يك شهر، يا طول رودخانههاي قارهي آسيا يك عدد را به طور تصادفي انتخاب كنيم، احتمال آنكه رقم اول از سمت چپ يك باشد چقدر است؟
10 درصد؟ 11 درصد؟
نه. بنفورد ميگويد اين احتمال حدود 30 درصد است، يعني تقريبا شانس يك به سه.
قانون بنفورد: در يك فهرست از اعداد و دادههاي آماري، احتمال آنكه رقم اول يك عدد (از سمت چپ) يك باشد، 30 درصد است.
به چه درد ميخورد؟
از اين قانون براي كشف تقلب در دادههاي اجتماعي/اقتصادي استفاده ميشود. مثلا فهرست هزينههاي يك شركت، تعداد آراء يك نامزد انتخاباتي در حوزههاي رايگيري، ....
اثبات دقيق آن هنوز ارائه نشده است. ميتوان ثابت كرد دادههاي تصادفي كه از توزيع نرمال پيروي نميكنند و ديمانسون دارند به دليل قانون توان چنين خاصيتي را نشان ميدهند. اما توجيه آن براي اعداد بدون ديمانسيون هنوز ناشناخته است.
تحقيق نشان داده كه متقلبها اعداد ساختگي را حول و حوش 5 و 6 درست ميكنند.
اين قانون را روي فهرستي از حدود 1300 شماره شناسنامه امتحان كردم و با دقت خوبي درست از كار درآمد. ميخواستم نتايج انتخابات نهمين دورهي رياست جمهوري در حوزههاي مختلف را با آن آزمايش كنم كه متاسفانه در پورتال وزارت كشور موجود نبود. (بقيهي دورهها بودند. چرا اين يكي نيست؟)
توضيح من ناقص و صرفا براي جلب توجه به مسئله است. لطفا منابع را ببينيد.
چند منبع خوب:
http://mathworld.wolfram.com/BenfordsLaw.html
http://en.wikipedia.org/wiki/Benford's_law
http://physorg.com/news98015219.html