מיד עם הודעתו של
יאיר לפיד על כניסתו לפוליטיקה, התפרסמו שלל סקרים הבוחנים את השפעת מפלגתו החדשה על תוצאות הבחירות, לו נערכו עכשיו. בין הסקרים התגלו פערים גדולים המעוררים את השאלה האם הם תוצאה של טעויות דגימה, או תוצאה של שיטות שונות באופן עקרוני לביצוע הסקרים.
אחת הדרכים לבחון את האפשרות שהנתונים הם תוצאה של טעויות דגימה היא ביצוע ניסוי ממוחשב שבו נכתבת תוכנית מחשב היוצרת מדגמים מלאכותיים. כל המדגמים האלה מופעלים על אוכלוסיה שהיא בעלת דפוסי הצבעה זהים, וההבדלים בין המדגמים נובעים אכן מהעובדה שלא כל האוכלוסיה נבדקת, אלא רק מספר מצומצם של נדגמים.
בניסוי ממוחשב כזה שערכתי, התייחסתי לשלושה סקרים: סקר של "מאגר מוחות" (יצחק כ"ץ) שבו גוש הימין-דתיים מנצח את גוש השמאל-ערבים בתוצאה 49:71, ויאיר לפיד מקבל 7 מנדטים. סקר של "דיאלוג" (קמיל פוקס) שבו גוש הימין-דתיים מנצח את גוש השמאל-ערבים בתוצאה 56:64, ולפיד מקבל 16 מנדטים, וסקר של "דחף" (מינה צמח) בו גוש הימין-דתיים מנצח את גוש השמאל-ערבים בתוצאה 54:66, ויאיר לפיד מקבל 11 מנדטים.
על-פי ממוצע הסקרים, באוכלוסיה הנדגמת היו לגוש הימין-דתיים 67 מנדטים, וללפיד 11 מנדטים. המדגמים היו של 480 נשאלים כל אחד, והשאלה היא מה הסיכוי שכתוצאה מטעות הדגימה יתקבל פער של 7 מנדטים ויותר בתוצאות של שלושת הסקרים לגבי הגושים (כפער בין ה-71 של כ"ץ, ל-64 של פוקס), ופער של 9 מנדטים ויותר בתוצאות של שלושת הסקרים לגבי לפיד (כפער בין ה-7 של כ"ץ, ל-16 של פוקס).
בהתייחס לתוצאת לגבי הגושים, הפער השכיח ביותר בין התוצאה המקסימלית למינימלית הוא 4 מנדטים, שקורה בערך מ-16% מהמקרים. הסיכוי לקבלת פער של 7 מנדטים ויותר הוא בערך 13%, סיכוי סביר בהחלט.
בהתייחס לתוצאות לגבי לפיד, הפער השכיח ביותר בין התוצאה המקסימלית למינימלית הוא 2 מנדטים בלבד, שקורה בערך ב-27% מהמקרים, לעומת זאת, הסיכוי לקבלת פער של 9 מנדטים ויותר הוא רק בערך 0.05%, סיכוי בלתי סביר לחלוטין!
תוצאות של הערכות, לא של סקרים בהתייחס לתוצאות לגבי לפיד, ניתן אפוא לקבוע בוודאות של 99.95% שהסוקרים לא באמת הציגו בפנינו תוצאות של מדגם אקראי שנערך על כל האוכלוסיה. אין כל ספק שהסוקרים אכן ערכו מדגמים, וביצעו סקרים טלפוניים, אך הם ודאי השתמשו בשיטות שונות של עריכת מדגמים, ובשיטות שונות של ניתוח התוצאות.
המסקנה החד-משמעית היא שההבדל העיקרי בין התוצאות השונות נובע מההבדלים בין הסוקרים, ולא מההבדלים האקראיים בין הנדגמים בסקריהם. אין אפוא כל משמעות לעובדה שנהוג להציג מתחת לתוצאות הסקרים את טעויות הדגימה שלהם, כי לא מטעויות הדגימה נובעים ההבדלים. על כן, יהיה זה הוגן יותר מצידם של הסוקרים להציג את תוצאותיהם בתור הערכות (או תחזיות) המבוססות על סקרים, ולא להציגן כתוצאות סקרים עם טעויות דגימה.