זיהוי סדר באקראיות (מתוך הספר "חשיבה חדה – בין מציאות לאשליה")

חשיבה חדה

בפוסט זה ובפוסט נוסף בעתיד אביא מקטעים מתוך "חשיבה חדה – בין מציאות לאשליה
" - ספר חדש מאת גלעד דיאמנט, כותב הבלוג חשיבה חדה. ישנו קשר טיבעי בין תוכן המאמר שלפניכם לתמה הכללית של בלוג זה. הספר ממנו שאוב המאמר מהווה מבוא מקיף לתחום החשיבה הביקורתית והספקנות המדעית, ומסכם שנים של תחקירים, תובנות ו"התנסויות בשטח". הספר יצא במימון הקוראים בגיוס הדסטארט, והוא נמכר בינתיים רק דרך האינטרנט. פרטים נוספים, המלצות ואפשרות רכישה - באתר הספר.

זיהוי סדר באקראיות

המוח שלנו עסוק כל העת בניסיון לפרש ולהסביר מה מתרחש סביבנו, מאיזו סיבה, לאיזו מטרה ואיך הדברים עשויים להיות קשורים אלינו. המוח שלנו מזהה תבניות ובונה סיפורים.

לבעלי היכולת לזהות תבניות בזריזות קיים יתרון אבולוציוני ברור. זיהוי מהיר של נמר בסבך העשב המתנועע יכול להבדיל בין חיים למוות. כמוהו גם הבחנה בין הורים לשאינם הורים; קישור בין צליל מסוים לאירוע שעלול לבוא בעקבותיו, כמו למשל רעש של עץ קורס; זיהוי קשרי סיבה ותוצאה, כמו למשל תוצאה של הכנסת יד לאש; זיהוי מקבצים של אירועים, כמו ריכוז של מקורות מזון או תכיפות של כאבים שעלולים להעיד על בעיה, ועוד.

לפעמים הזיהוי שגוי. שגיאה מסוג–1 היא זיהוי יתר, כלומר זיהוי תבנית במקום שבו היא אינה נמצאת בפועל, למשל זיהוי נמר בעוד שבמציאות מדובר רק בעשב מתנועע. שגיאה מסוג–2 הוא זיהוי חסר, כלומר אי זיהוי תבנית במקום שבו היא נמצאת בפועל, למשל זיהוי עשב בעוד שבמציאות נע לעברנו נמר. די ברור לאיזה כיוון "עדיף" למוח שלנו לטעות — זיהוי יתר כמובן. Better safe than sorry.

נטייתו של המוח שלנו לזהות תבניות ומשמעות היא כה חזקה, עד שלעתים אנחנו מוצאים סדר ומשמעות גם במקומות שבהם הם אינם בנמצא. היות שנטייה זו אינה מודעת, הדבר מוביל אותנו לא פעם למסקנות שגויות ולאמונה בתופעות שכלל אינן קיימות.

"השכל האנושי, מעצם טבעו, נוטה להניח קיומם של יותר סדר וחוקיות בעולם מאשר בנמצא"

- פרנסיס בייקון, Novum Organum, 1620

להמשיך לקרוא

אינפוגרפיקה מטעה: בנק ישראל הוריד את הריבית (ל-0.5%) – אבל לא כמו שזה נראה

היום פורסם ב- ynet ש:

אחרי הפוגה של חמישה חודשים, החליטה היום (ב') הוועדה המוניטרית של בנק ישראל לחדש את הפחתות הריבית והודיעה על הורדת הריבית לחודש אוגוסט ב-0.25%, לנקודת שפל של 0.5%. זאת לאחר שהפחתת הריבית האחרונה שביצע בנק ישראל הייתה כאמור בסוף חודש פברואר.

בכתבה הופיע התרשים הבא:

ribit-2014_aug_big

אך כאשר מתבוננים בריבית של חודש אוגוסט, מתקבל הרושם שהירידה הייתה דרמטית מאד, יותר (למעשה, פי 2) מאשר במעבר מפברואר למרס (למרות שבשני המקרים הירידה הייתה באותה מידה של 0.25%). בדיקה דקדקנית יותר עם עורך גרפי מדגים שזה אכן המקרה:

ha-ribit

שתי הערות נוספות:

  • נקודת ההתחלה של העמודות השונות איננו מציר ה- 0 (מה שקצת מקצין את מידת הירידה), וגם
  • שמתם לב שמיקום תרשימי העמודות אינו ממוקם באופן סימטרי באמצע הפס הציבעוני על פני החודשים השונים? משום מה דצמבר, ינואר ופברואר מיושרים לימין

לטובת ynet, ושאר הקוראים, הנה אותם הנתונים (הגרף יוצר באקסל), אבל כאשר גבהי העמודות נשארות נאמנות לנתונים:

ha-ribit2

אתם מוזמנים להוריד את האקסל מכאן (ולהשתמש בו, או במשהו דומה, בכתבות ההמשך שלכם – אנא עשו זאת).

 

זו דוגמא (מצערת) לחוסר תאימות בין הנתונים המספריים להצגה הגרפית שלהם, זה מיותר (בעיני) לפגום כך ביכולת של הקורא לקבל מושג כמותי וויזואלי לגבי המציאות (ועוד כשכל כך קל לייצר תרשים תקין) – ואני מקווה שאתר חדשות מרכזי כמו ווינט יעשה מאמץ לשפר את התרשימים שלהם בעתיד.

עידכון: ווינט תיקנו את הטעות בתרשים שמופיע אצלם בכתבה :) (למרות ששתי ההערות שציינתי עדיין לא תוקנו)

האם צה"ל תוקף אזרחים וטרוריסטים פלסטינים באותה המידה? (במבצע "צוק איתן")

על השאלה הזו החליט איליה זורוב (פרופיל פייסבוק) לענות באמצעות איסוף נתונים והצעת ניתוח סטטיסטי עבורם. לפני שנתחיל, ברצוני לציין שכל מוות של חף מפשע הוא טרגדיה נוראית. איני בא לומר האם המבצע הצבאי של ישראל הוא ראוי או לא, האם ניתן היה למנוע אותו או לא, או מה "צריך לעשות". אבל כן חשוב לי לשתף בפוסט הזה שהנתונים הסטטיסטיים ממחישים שלמרות הטרגדיות, צה"ל עושה את מה שהוא אומר שהוא עושה – מנסה לפגוע במחבלים, ולא לפגוע בחפים מפשע (בהצלחה פחותה מכפי שהיינו רוצים, אבל זו סוגיה מורכבת שלא נכנס אליה כאן). אשמח לתגובות אינפורמטיביות על התוצאות (והמלצות על ניתוחים/נתונים חלופיים).

מספר ההרוגים הפלסטינים מבין המעורבים והבלתי מוערבים

(תרשים באדיבות גלעד דיאמנט)
להמשיך לקרוא

השפעת סדר האירוח במפגשי גומלין בכדורגל על זהות המנצחת

בניגוד לדעה הרווחת, לא ניתן לקבוע שסדר האירוח במפגשי גומלין בליגת האלופות מקנה יתרון למארחת המשחק השני.

בסמסטר ב' של 2014, התלמידים אורי פריילכמן, אריאל בוקאי, יותם חרובי ונעמה לסט, החליטו לבדוק במסגרת פרוייקט המחקר שלהם לקורס מבוא לסטטיסטיקה לסטטיסטיקאים אודות ההשפעה של סדר אירוח על המשחק השני במסגרת ליגת האלופות. הנתונים נאספו באופן יסודי, הניתוח הסטטיסטי נעשה היטב, תחת הסייג שהוא ברמה של קורס מבוא, עם כל ההשלכות מכך – לא מדובר במחקר מדעי שעבר ביקורת עמיתים, אז כל מסקנה שמופיע בפוסט זה יש לקחת בערבון מוגבל ולהפעיל חשיבה ספקנית (אף יותר מהרגיל!).
לצורך ההתאמה למדיום, הרשיתי לעצמי לקצץ חלקים מסויימים מהעבודה (אך לא ביצעתי/שיפרתי את המחקר עצמו. כך שאם יש שאלות – מקומן הוא בתגובות).
אם יש לכם שאלות של סקרנות, הצעות לשיפור, ו
מחמאות לתלמידים (ורצוי שיהיו!) אתם מוזמנים לכתוב אותם בתגובות.
וללא מילים נוספות - אני גאה להציג בפניכם את תוצאות המחקר:

תמצית המחקר

ליגת האלופות של אירופה, טורניר הכדורגל היוקרתי ביותר למועדונים, נערך מדי שנה על ידי אופ"א (UEFA), ארגון הגג של התאחדויות הכדורגל האירופאיות. חלק משלבי התחרות נערכים במתכונת המכונה מפגשי גומלין (knockout ties). לפי מתכונת זו, נפגשות שתי קבוצות לזוג משחקים. המנצחת היא זו אשר הבקיעה יותר שערים בסיכום שני המשחקים. כדי לקיים תחרות הוגנת, מארחת כל קבוצה משחק אחד.

במחקר הבא נציג שתי שאלות מחקר. שאלת המחקר הראשונה תתייחס למדגם כולו ותבדוק האם יש לסדר האירוח השפעה על זהות המנצחת במפגשי גומלין. שאלת המחקר השנייה תעסוק רק באותם מפגשים בהם הסתיים המשחק הראשון מבין השניים בתיקו אפס. כאן נרצה לדעת האם סיכוייה של המארחת השנייה לנצח גבוהים מאלה של המארחת ראשונה.

לצורך המחקר אספנו נתונים אודות כל 394 מפגשי הגומלין שהתקיימו בין השנים 1970 – 2012, בהם נקבע סדר האירוח על ידי הגרלה. גילינו כי 53% מהמפגשים הסתיימו בניצחונה של המארחת השנייה, אך לא היה בממצא זה כדי לקבוע כי אירוח המשחק השני מקנה יתרון. לעומת זאת, מצאנו כי 69% מהמפגשים בהם הייתה תוצאת המשחק הראשון תיקו אפס, הסתיימו בניצחונה של המארחת השנייה.

לסיכום, לא ניתן לקבוע באופן כללי, שסדר האירוח משפיע על זהות המנצחת במפגשי גומלין, עם זאת, ניתן לקבוע כי אם המשחק הראשון מסתיים בתיקו אפס, סיכויי המארחת השנייה לנצח גבוהים מאלה של המארחת הראשונה.

להמשיך לקרוא

רשמים מכנס useR!2014

photo (1)

שבוע שעבר נהניתי להשתתף בכנס useR!2014 אשר התקיים באוניברסיטת UCLA בקליפורניה, ארה"ב. הכנס הוא המפגש השנתי של אנשי קהילת ה- R מרחבי העולם, כשהשנה השתתפו בו כ-700 אנשים מהקהילה. (למי שלא מכיר, R היא שפת תוכנה, בקוד פתוח, לתכנות סטטיסטי). אם לסכם, אומר שמדובר היה בחוויה מדהימה. זו הפעם החמישית שאני משתתף בכנס הזה, ומבין כל הכנסים המקצועיים שהיו בחיי, אין ספק שכנסי ה- useR הם הכי מספקים מבחינתי (ברמה המקצועית, האינטלקטואלית, והרגשית). מעבר לתוכן העיוני, הפתיחות והחברותיות של האנשים בקהילת ה- R, היא בדיוק סוג הדברים להם אפשר לצפות במפגשים של תוכנת קוד פתוח.

אם R קרוב לליבכם, אפילו אם אתם בתחילת דרככם, אני מעודד אתכם לעשות מאמץ ולהגיע למפגש useR!2015 אשר יתקיים שנה הבאה בדנמרק (ובמקרה שתעשו כן, אנא שלחו לי מייל – tal.galili@gmail.com, אשמח לדעת שאתם מגיעים).

בשאר הפוסט אני אציף נקודות שעלו לי סביב הכנס. אני לא ממש אלמד אף אחת מהן, ואני גם לא אסקור את כל מה שהיה. אבל אני מקווה שמשהו מזה תמצאו מעניין. להמשיך לקרוא

מה סטודנטים באונ' ת"א רוצים בבחורה?

יצאנו לבדוק מה גברים רוצים וגילינו שאנחנו לא יודעות כלום. אמרתם שנשים מסובכות?

בינואר 2014, התלמידות מור גבע, טלי אורנבך, אורטל שנפס, החליטו לבדוק במסגרת פרוייקט המחקר שלהן לקורס מבוא לסטטיסטיקה למדעי המחשב, מה סטודנטים זכרים באוניברסיטת תל אביב מחפשים בבחורות. הנתונים שנאספו הם מעניינים ביותר והניתוח הסטטיסטי נעשה עם מחשבה, תחת הסייג שהוא ברמה של קורס מבוא, עם כל ההשלכות מכך – לא מדובר במחקר מדעי שעבר ביקורת עמיתים, אז כל מסקנה שמופיע בפוסט זה יש לקחת בערבון מוגבל ולהפעיל חשיבה ספקנית (אף יותר מהרגיל!).
לצורך ההתאמה למדיום, הרשיתי לעצמי לקצץ חלקים מסויימים מהעבודה (אך לא ביצעתי/שיפרתי את המחקר עצמו. כך שאם יש שאלות – מקומן הוא בתגובות). ניתן להוריד את העבודה המלאה מקישור זה.
אם יש לכם שאלות של סקרנות, הצעות לשיפור, ו
מחמאות לתלמידות (ורצוי שיהיו!) אתם מוזמנים לכתוב אותם בתגובות.
וללא מילים נוספות - אני גאה להציג בפניכם את תמצית תוצאות המחקר:

מה לדעתכן מחפש הסטודנט הזה בבחורות?

מה לדעתכן מחפש הסטודנט הזה בבחורות?

תמצית המחקר

מחקר זה נכתב כתגובה למחקר אחר שנעשה בפקולטה לפני מספר שנים, המבקש להבין את רצונותיהן של סטודנטיות באונ' ת"א בבן-זוג. במחקרנו ניסינו לאמוד את רצונותיהם של סטודנטים גברים מאונ' ת"א – הן במבט כולל על האלמנטים החשובים לסטודנט במראה הבחורה, והן במבט על רצונות הסטודנט כתלות בפרמטרים שונים אודותיו, כמו גילו ותחום לימודיו. המחקר מבוסס על סקר שערכנו באונ', שכלל 238 נסקרים. מסקנותינו העיקריות:

  • מחצית מהגברים מעניקים חשיבות לרמת הניסיון המיני של הבחורה, ומגבילים אותה ברמה מסויימת.
  • אין קורלציה בין סוג הקשר שמחפש הסטודנט (ארוך טווח או מזדמן), לבין היותו "חסוד" או לא (מבחינת החשיבות שמעניק לרמת הניסיון המיני של הבחורה).
  • החזה והישבן חשובים במידה שווה.
  • הסטנדרטים למראה לא משתנים עם הגיל, אך משתנים מפקולטה לפקולטה. [הערת המתרגל: מסקנה זו היא בערבון מוגבל מאד]   

להמשיך לקרוא

'סטטיסטיקה אפרמטרית' מאת אלונה רביב – הורדה חופשית של הספר!

בכבוד והתרגשות, אני שמח לבשר לכם שדוקטור אלונה רביב החליטה לשחרר לחופשי את המהדורה השניה של הספר "סטטיסטיקה אפרמטרית".

באפשרותכם להוריד את הספר אל המחשב באמצעות הקישור הבא:
סטטיסטיקה אפרמטרית, אלונה רביב (מהדורה שניה)
או לצפות בו כאן:

על הספר

בספר סטטיסטיקה אפרמטרית מוצגות השיטות האפרמטריות המקובלות ביותר, באופן שיתאים כספר לימוד לקורס סמסטריאלי של שלוש שעות שבועיות. הספר נכתב לתלמידים הלומדים סטטיסטיקה כחוג ראשי או משני, והוא פרי ניסיון רב של המחברת בהוראת קורס כזה בחוג לסטטיסטיקה וחקר ביצועים באוניברסיטת תל אביב. הספר מתאים גם לתלמידים בחוגים אחרים, אשר למדו קורס אלמנטרי במבוא לסטטיסטיקה בלבד, ואשר לומדים שיטות אפרמטריות כקורס נפרד או כחלק מקורס בסטטיסטיקה.
הניתוח הסטטיסטי והסקת המסקנות מובאים בצורה פשוטה וברורה המתאימה לקהל רחב של קוראים. על כן הספר יכול להיות לעזר רב לחוקרים במדעי החברה, בביולוגיה או ברפואה, שזקוקים בעבודתם לשימוש בשיטות אפרמטריות לצורך הניתוח הסטטיסטי.
הספר מכיל מבחר של תרגילים עם תשובות לחלקם הגדול וכן טבלאות התפלגות של רוב המבחנים המובאים כאן.
הספר יצא לראשונה בדפוס בהוצאת עמיחי (2006).
המהדורה השניה, האלקטרונית הזאת (בהוצאת המחברת) של הספר "סטטיסטיקה אפרמטרית" הוכנה לשימוש חפשי של מרצים, סטודנטים וחוקרים המתעניינים בנושא.

(C) – שימוש מסחרי מכל סוג שהוא בחומר הכלול באתר זה אסור בהחלט, אלא ברשות מפורשת בכתב מאת המחברת.

פרקי הספר כוללים:

  • פרק 1. מבוא להסקה סטטיסטית: מבחני תמורות
  • פרק 2. מבחן ווילקוקסון לשני מדגמים בלתי תלויים
  • פרק 3. מבחנים נוספים להשוואת שתי התפלגויות
  • פרק 4. מדגם מזווג
  • פרק 5. השוואת יותר משני מדגמים בלתי תלויים
  • פרק 6. מדדי קשר בין שני משתנים, מקדמי מתאם
  • פרק 7. ניתוח דו–כיווני — בלוקים אקראיים

על המחברת

ד"ר אלונה רביב שימשה שנים רבות כמרצה בחוג לסטטיסטיקה וחקר ביצועים באוניברסיטת תל אביב ולימדה קורסים רבים בסטטיסטיקה לתואר ראשון ולתואר שני . היא חיברה , יחד עם פרופ' תלמה לויתן , את שני הספרים המצליחים במבוא להסתברות וסטטיסטיקה : "הסתברות " ו"הסקה סטטיסטית", בהוצאת "עמיחי".

הומאופתיה לא עובדת – תרשים זרימה של טיעונים נפוצים

הומאופתיה היא קישקוש. היא לא עובדת, היא לא "בערך" עובדת, היא גם לא עובדת "לפעמים". היא פשוט לא עושה שום דבר מעבר למקריות ולאפקט הפלאסבו (לפי מכלול מאד מאסיבי של ראיות אשר הגיעו ממחקרים מדעיים מאד מושקעיים, יותר ממה שלדעתי הגיע לתחום הפסאבדו-רפואי הזה).

אם אתם קוראים קבועים של הבלוג הזה, רוב הסיכויים שאתם מסכימים עם מה שכתבתי. עם זאת, סביר להניח שחלק מחבריכם לא מסכימים איתכם. במקרה כזה, יש סידרה של טיעוני נגד (יותר מידי) נפוצים אשר אתם צפויים להיתקל בהם, באם תאמרו לחבריכם את דעתכם על הומאופתיה.

כדי לחסוך לכם (ולי) זמן, גלעד דיאמנט עשה את מלאכת הקודש (או הדבר הכי קרוב לזה, עבור אתאיסט גמור), של לרכז את סידרת הטיעונים בעד (ואז נגד) האפקטיביות (כביכול) של הומאופתיה. אתם מוזמנים להפיץ את התרשים בפייסבוק, בבלוג שלכם, באימייל, לחברים, או לתלות עותק מודפס בחדר הישיבות של המשרד. אני לא חושב שזה ישנה את דעתם של מאמינים כבדים, אבל זה עשוי "לחסן" מוחות צעירים מהפיתוי של אמונות שווא. הנה התרשים (ניתן ללחוץ עליו לגירסה מוגדלת)

homeopathy_is_bullshit

התרשים הופיע במקור בבלוג "חשיבה חדה" בפוסט על הומאופתיה אשר כולל הרבה קישורים וסרטונים שימושיים. הנה רק אחד מאותם סרטונים חביבים (3 דקות על מה זה הומאופתיה, וכיצד מבצעים ניסויים אשר בוחנים את ההומאופתיה):

להמשיך לקרוא

הבחירות לכנסת ה- 19 (בשנת 2013) – איפה הסקרים הצליחו ואיפה הם כשלו?

 seker_vs_reality_elections2013

הבחירות הסתיימו, אני הצבעתי, ועכשיו כשהאבק מתחיל לשקוע אנו יכולים להתרווח ולבדוק את הקשר בין תחזיות הסקרים לתוצאות בשטח. יש דרכים רבות לדון בשאלות הללו, מה שבחרתי לעשות היום זה לקחת את הסקר של פרופסור קמיל פוקס (דיאלוג), שהתפרסם חמישה ימים לפני הבחירות לכנסת ה- 19 (אשר התקיימו ב- 22.01.2013), בעיתון הארץ (קישור לתוצאות הסקר) ולענות על כמה שאלות:

  1. עד כמה קרובים היו תחזיות הסקר לתוצאות האמת?
  2. האם 19 המנדטים שקיבלה "יש עתיד" היו בתוך טווח הטעות הסבירה או לא?
  3. האם לארץ חדשה היה סיכוי לעבור את אחוז החסימה?
  4. האם יש עדות מובהקת לכך שהסקרים של הארץ מוטים לכיוון השמאל-מרכז?

הפוסט הזה יכלול את עיקרי הדברים (אפשר לקפוץ לסוף הפוסט לריכוז המסקנות), ואם תרצו לראות את החישובים המדוייקים, אתם מוזמנים להוריד את המסמך מהקישור שכאן.

להמשיך לקרוא

מטוס עם מאה מקומות ישיבה מסומנים – חידה קטנה בהסתברות

חבר שלח לי חידה נחמדה שחשבתי לחלוק איתכם:

יהי מטוס עם מאה מקומות ישיבה מסומנים.
הנוסע הראשון נכנס למטוס, מגלה שאיבד את כרטיס הטיסה שלו ולכן מתיישב באופן אקראי באחד ממאה המושבים.
כל נוסע שמגיע אחריו (שני ועד לאחרון) פועל באופן הבא: אם מקומו נתפס כבר, הוא בוחר באקראי מקום פנוי מאלו שנותרו, ואם מקומו פנוי הוא מתיישב בו.
השאלה היא מה הסיכוי שהנוסע האחרון (המאה) ישב במקומו?

התשובה לחידה היא:
להמשיך לקרוא