ארכיון תגיות: סטטיסטיקה

הומאופתיה לא עובדת – תרשים זרימה של טיעונים נפוצים

הומאופתיה היא קישקוש. היא לא עובדת, היא לא "בערך" עובדת, היא גם לא עובדת "לפעמים". היא פשוט לא עושה שום דבר מעבר למקריות ולאפקט הפלאסבו (לפי מכלול מאד מאסיבי של ראיות אשר הגיעו ממחקרים מדעיים מאד מושקעיים, יותר ממה שלדעתי הגיע לתחום הפסאבדו-רפואי הזה).

אם אתם קוראים קבועים של הבלוג הזה, רוב הסיכויים שאתם מסכימים עם מה שכתבתי. עם זאת, סביר להניח שחלק מחבריכם לא מסכימים איתכם. במקרה כזה, יש סידרה של טיעוני נגד (יותר מידי) נפוצים אשר אתם צפויים להיתקל בהם, באם תאמרו לחבריכם את דעתכם על הומאופתיה.

כדי לחסוך לכם (ולי) זמן, גלעד דיאמנט עשה את מלאכת הקודש (או הדבר הכי קרוב לזה, עבור אתאיסט גמור), של לרכז את סידרת הטיעונים בעד (ואז נגד) האפקטיביות (כביכול) של הומאופתיה. אתם מוזמנים להפיץ את התרשים בפייסבוק, בבלוג שלכם, באימייל, לחברים, או לתלות עותק מודפס בחדר הישיבות של המשרד. אני לא חושב שזה ישנה את דעתם של מאמינים כבדים, אבל זה עשוי "לחסן" מוחות צעירים מהפיתוי של אמונות שווא. הנה התרשים (ניתן ללחוץ עליו לגירסה מוגדלת)

homeopathy_is_bullshit

התרשים הופיע במקור בבלוג "חשיבה חדה" בפוסט על הומאופתיה אשר כולל הרבה קישורים וסרטונים שימושיים. הנה רק אחד מאותם סרטונים חביבים (3 דקות על מה זה הומאופתיה, וכיצד מבצעים ניסויים אשר בוחנים את ההומאופתיה):

להמשיך לקרוא

כנס לסטטיסטיקאים: "נושאים נבחרים בהנדסת שירות" – כניסה חינם בהרשמה מראש

הכנס הרביעי של הקבוצה הישראלית ליישומי סטטיסטיקה בתעשייה ובעסקים
יתקיים ביום שלישי, 30 בנובמבר 2010,
בבית חיל האויר – רח' ז'בוטינסקי 15, הרצליה.

לחצו כאן כדי להירשם

להל"ן תוכניית הכנס:

להמשיך לקרוא

האם (בארה"ב) למפגינים כנגד רפורמת הבריאות יש תפיסה מוטה של מיסוי במדינתם?

רקע (מקור: ויקיפדיה)

בארה"ב, החוק להגנת החולה וטיפול בר השגה (אנגלית: Patient Protection and Affordable Care Act) הוא חוק (חלק מרפורמת הבריאות) שנועד להסדיר מתן שירותי בריאות לתושבי ארצות הברית. החוק נועד למנוע את המצב בו עשרות מיליוני אמריקנים אינם מבוטחים, למנוע מאמריקנים שמבוטחים לאבד את ביטוח הבריאות שלהם עקב החלפת מקום העבודה דרכו הם מבוטחים, או עקב טענות חברות הביטוח שהטיפולים נובעים ממצב בריאותי שקדם לתחילת הביטוח, ונועד למתן את הגידול בהוצאות על בריאות. החוק אושר בבית הנבחרים ב-21 במרץ 2010. נשיא ארצות הברית, ברק אובמה, אישר את החוק למחרת. אובמה הצהיר כי הוא מחשיב את החוק בתור ההישג הפוליטי הגדול ביותר שלו.
הרפורמה במערכת הבריאות תבטיח לראשונה ביטוח בריאות ליותר ל-30 מיליון אמריקאים שעד לאישורו לא היו מבוטחים כלל.

בשבלינו אזרחי מדינת ישראל, אשר כולנו מקבלים ביטוח בריאות כחלק מהותי משירותי המדינה אלינו, המצב של אזרחים בארה"ב (ומה שהרפורמה הזו מנסה לפתור) יכול להיות בלתי נתפס.

המחלוקת – "מפגיני מסיבת התה"

על פניו, נישמע שכולם צריכים לתמוך בזה (וברפורמת הבריאות באופן כללי), אך זה איננו המצב. קבוצה של (לרוב, רפובליקנים) החלו תנועה של הפגנות המכונות "הפגנות מסיבת התה" (עוד על כך כאן), אשר מפגינים בכלל על כל צורה של העלאת מס, ובפרט העלאת המס שתידרש (שאני לא בטוח עד כמה היא בכלל תהיה) בעקבות העברת רפורמת הבריאות שאובאמה קידם.

כדי להמחיש את הדרמטיות של התנגדות המפגינים, הנה סרטון (של פחות מדקה) המראה כיצד מפגינים צועקים על חולה פרקינסון שהתיישב והפגין (בעד רפורמת הבריאות) כנגד המפגינים (כנגד רפורמת הבריאות)

אגב, חולה הפרקינסון הזה הוא בן 60, אובחן בפרקינסון לפני 15 שנה, ולפני כן הוא עבד כמהנדס גרעיני. הוא מחזיק שני תארים שניים ודוקטורט מאוניברסיטת קורנל. הסיבה שהוא עוד לא מת היא כי הוא שילם (בעזרת ביטוח בריאות חלקי) 150,000$ עבור ניתוח שנועד להעריך את איכות חייו. ניתוח שבארץ, כנראה, שהוא היה מקבל גישה אליו בהשתתפות סימלית בהרבה. זה למה הוא מפגין בעד רפורמת הבריאות שאובאמה והדמוקרטים מקדמים. (הנה סרטון שבו בוב, חולה הפרקינסון, מדבר)

אז למה הם מתנגדים?

אחת השאלות שדמוקרטים (כמו, לדוגמא, אישתי הנהדרת) שואלים היא מדוע בכלל האנשים הללו מתנגדים לרפורמת הבריאות. הרי המצב כיום בארה"ב הוא מפלצתי, לפיו המערכת איננה מסוגלת לחשוב באופן של רפואה מונעת, וכל ניסיון להיעזר בשירותי הבריאות מסתכם במאבק (של אנשים חולים) למול חברות הביטוח, אשר יכול בפעמים רבות להוביל לפשיטת רגל של החולה (זו, מסתבר, אחת הסיבות השכיחות ביותר לפשיטות רגל בארה"ב – טיפול רפואי לאנשים ללא ביטוח בריאות "טוב").

וזה מוביל אותנו לסטטיסטיקה.

תפיסת המיסוי של ארה"ב אצל "מפגיני מסיבות התה"

דוד פרום (מישהו), הגיע לאחת מההפגנות של מסיבות התה, ופנה אל המפגיני בשאלה פשוטה "(לדעתכם) כמה מיסים גובה ממשלת הממשלה הפדרלית בארה"ב מהמשק?". על השאלה השיבו 60 מתוך כמה מאות המפגינים שנכחו במקום. הסטטיסטיקות שקיבלנו מתשובות הנבדקים היו (מקור):

תשובה ממוצעת: 42.06% (זוהי התשובה הממוצעת של אחוז המיסוי שאנשים אלו מאמינים שארה"ב גובה מהמשק)
סטיית תקן: 19.06%
מספר מפגינים שנשאלו: 60

התשובה הנכונה היא (על סמך המקור) 31.5%, שזה פחות ממה שהמפגינים ענו בממוצע. השאלה (הסטטיסטית) היא האם אמונת המפגינים לגבי שיעור המס היא מוטה כלפי מעלה באופן מובהק.

ננסח את השאלה באופן יותר מדויק: בהנחה שהמדגם של 60 איש שנשאלו הוא מדגם מייצג לדעות של אנשים מהסוג שמשתתפים בהפגנות מסוג זה (כלומר שהסוקרים לא פנו לשאול, לדוגמא, רק את האנשים שנראו הכי קיצוניים בהפגנה), האם יש לנו מספיק נתונים כדי לדעת האם הדעות של הפגינים מוטות (באופן מובהק סטטיסטית) להיות מעל למציאות? התשובה לדעתי היא כן.

ננסח את השאלה שוב (הפעם, יותר "סטטיסטית"): האם יש לנו עדות מספקת להניח שהתוחלת של התפלגות התשובות של המפגינים, היא שונה (באופן מובהק סטטיסטית) מהערך האמיתי? (זוהי השערת ה-0. ההשערה הנגדית אומרת, שייתכן והמפגינים כן ענו, בממוצע, את הערך הנכון)

באמצעות משפט הגבול המרכזי (לינק למאמרון ויקיפדיה בנושא) נענה על השאלה. לפיו אנו יודעים שהתוחלת של תשובות המפגינים שואפת להתפלגות הנורמאלית. לפי זה נוכל לחשב מהו הרווח בר-סמך התחתון של תוחלת תשובת המפגינים (או בתרגום: מהו הערך הנמוך ביותר שהיינו יכולים לחשוד שהוא הממוצע/התוחלת האמיתית של תשובות המפגינים). המספר יהיה:

42.06 – 1.96 * 19.06/sqrt(60) = 37.24

כלומר, המספר הכי נמוך (כאשר מדברים על רווח בר סמך דו-צדדי) של 95%) שאפשר לצפות שהוא התוחלת האמיתית של תשובות המפגינים, הוא 37.24%. שזה יותר גבוה מ – 31.5% מס (שהוא הערך האמיתי).

למעשה, ההסתברות שנקבל את התוצאות שקיבלנו מהשאלון, בהינתן שהערך האמיתי של תוחלת תשובות המפגינים היא 31.5% היא ערך P (P value) – של  1.623788e-05

(הפקודה ב- R לחישוב היא:

dnorm(42.06,31.5, 19.06/sqrt(60))

)

שאלה שניה שנשאלה הייתה "כמה מס הכנסה פדרלי אתם מאמינים שמשלמת משפחה ממוצעת (עם הכנסות של 50000$ לשנה) ?"
ביחידות של 1,000 דולר, התשובות היו:
תשובה ממוצעת: 12.71
סטיית תקן: 12.06
מספר מפגינים שנשאלו: 60
התשובה הנכונה היא (על סמך המקור) 7.5, שזה פחות ממה שהמפגינים ענו בממוצע. השאלה (הסטטיסטית) היא האם אמונת המפגינים לגבי שיעור המס (המוטל על משפחה ממוצעת) היא מוטה כלפי מעלה באופן מובהק.

כמו קודם, החישוב מראה שכן. עם ערך P של: 0.00094
קוד ה- R לחישוב היה:
dnorm(7.5,12.71, 12.06/sqrt(60))

(קישורון לכיף – הנה דוגמא לפוסט שיוסי לוי כתב בזמנו, בו הוא גם השתמש במשפט הגבול המרכזי: "סקר לדוגמא")

אז מה המסקנה?

המסקנה שלי מהסקר היא שאנשים שלא רוצים שיעלו את המיסים בארה"ב, יש תפיסה פסימיסטית לגבי מצב המיסוי הנוכחי בארה"ב.

שאלת המליון היא מהי כיוון הסיבתיות במקרה שלנו. האם התפיסה הפסימיסטית הזו היא זו שמובילה את האנשים להפגין (ולתת כזה יחס עויין לנושא), או שבגלל שלאנשים אלו יש סיבות אידיאולוגיות לוחמניות כנגד מיסוי (לא משנה איזה מיסוי), הם נוטים להגזים במה שהם חושבים שהוא מצב המיסוי הקיים בארה"ב.

אילו האפשרות הראשונה הייתה נכונה – אז ייתכן שמתן המידע המעודכן לגבי המצב המדוייק, הייתה עוזרת. אילו האפשרות השניה היא הנכונה (מה שהוא הניחוש שלי), אז הסיפור הוא אידיאולוגי/מוסרי – והדיון בו ראוי להתקיים במישור הזה.

אגב, כששאלתי את אישתי מה היא מנחשת שהוא אחוז המיסוי בארה"ב, היא ניחשה 25%. (לא רלוונטי, כיוון שאינני בטוח שאפשר להשוות את המדינה ממנה אישתי מגיעה למדינה שממנה הגיעו הנסקרים)
זה היה יכול להיות מעניין לחזור על סקר דומה באוכלוסיה רחבה יותר, ולראות כיצד התפיסה משתנה לפי עמדות פוליטיות.

* * * *
עידכונים בפוסט:
1) אנשים בתגובות תיקנו אותי שהשאלה נשאלה על מס פדרלי שנגבה, ולא "מס" באופן כללי.
2) אנשים שאלו כיצד המספר היחיד ה"נכון" של המס חושב, בהינתן זה שזהו מס שמשתנה בין מדינות. התשובה היא שאינני יודע. אני משער שמדובר במס הרלוונטי במדינה שבה נערך הסקר. הקורא החרוץ מוזמן לעקוב אחר הקישורים שסיפקתי כדי למצוא את הידיעה המקורית ולראות אם הכותב מספק תשובה. בפוסט זה הנחתי שהוא יודע על מה הוא מדבר (ייתכן וטעיתי, אבל לכרגע אני מרשה לעצמי אופטימיות)

* * * *

תגובותיכם יתקבלו בברכה 🙂

הפער בתחזית הפער: 3 או 12 (על סקרי בחירות ומיגבלותיהן)

המאמר שלפניכם הוא פרי מקלדתו של פרופסור יואב בנימיני מאוניברסיטת תל אביב. קריאה מהנה:

* * *

ביום רביעי שעבר פורסמו בשני ערוצי טלביזיה שני סקרי בחירות. לפי הסקר שפורסם בערוץ 10 היה לליכוד יתרון של 3 מנדטים על קדימה. לפי הסקר שפורסם בתוכניתו של נסים משעל בערוץ 2 היתרון היה 12 מנדטים. כיצד אפשר להגיע לפערים שכאלה? האם בכלל יש אמינות לסקרים בטרם בחירות, וכיצד למנוע את ההשפעות השליליות על ציבור הבוחרים?

סקר הבחירות שמפורסם במוצאי יום הבחירות הוא בגדר שעשוע תקשורתי ואינטלקטואלי – התוצאות האמיתיות כבר נקבעו, ויודעו בתוך יום. לעומת זאת לסקר בטרם בחירות השפעה רבה. הבוחרים יכולים ללמוד דרכו על התוצאה המסתמנת ומתוך כך לבחור לחזק או להחליש גוש מפלגות על ידי תמיכה במפלגה מסוימת, כמו גם לתמוך במפלגה שהיא בסביבת אחוז החסימה או להימנע מכך. המחוקקים בישראל הכירו בחשיבותם והשפעתם של סקרי בחירות בתקופה הסמוכה לבחירות, וקבעו כללים מיוחדים לפירסום תוצאותיהם.

כיצד יכולים להופיע פערים גדולים כל כך בתוצאות סקרים? נלך מהחשוב פחות אל החשוב יותר: למי שמממן את הסקר עלולה להיות השפעה אפשרית, על ידי הטיות קטנות במהלכו, כמו בחירת האוכלוסיה המיוצגת בסקר, סדר השאלות, או אפילו השפעה על נוסח השאלה שנשאלה. כך ניתן לצפות לשינוי ניכר בתשובה באם השאלה היא: "כידוע יש חשיבות בימים סוערים אלו לעמידה איתנה. מי לדעתך…" וזאת לעומת הפתיחה "כידוע גם בימים בוערים אלו יש לשמור על אופק של שלום. מי לדעתך…". לכן, כאשר דובר מפלגה מסוימת מדווח בשידור "לפי סקר בידינו", הזהירות צריכה להיות רבה. אם המממן ועורך הסקר הם גופים חסרי פניות אין לצפות להטיה מכוונת בהקשר זה.

חשוב מכך להבין מה גודל המדגם אליו פנו, איזה חלק ממנו סירב להשיב, ואיזה חלק מהמשיבים עדיין מתלבטים ומהווים קולות צפים. טעות הדגימה הניתנת בחלק מפרסומי הסקרים עונה על השאלה עד כמה יכולה להיות תוצאת הסקר שונה לו אנשים אחרים היו עולים במדגם. כך למשל, נתוני הסקר שפורסם בערוץ 10 פורסמו למחרת ב"הארץ" ומהם ניתן היה ללמוד שטעות הדגימה אינה מבוטלת: 3.2% שהם קרוב ל4 מנדטים. (עבור הפער בין שתי המפלגות הטעות גדלה לכ-6 מנדטים)

אולם לטעות זו מתווספות שתי בעיות שיכולות להיות חמורות יותר. המסרבים להשיב – שמעידים אולי על הטייה שיטתית שכיוונה אינה ידוע כלל, ואלו שטרם החליטו. כך למשל, המספר הגבוה של המסרבים להשיב הפיל כנראה בפח את סוקרי הפריימריז. הבלתי מחליטים מאתגרים תמיד את הסוקרים השונים כאשר לכל אחד שיטות שונות לפלח את דפוס הצבעתם העתידי, כמו גם לחזות באם ילכו לקלפי, על מנת לתת תחזית מנדטים. כמובן שהשיטה נשמרת בסודיות על ידי כל סוקר, אבל כל בוחר יכול לעמוד על גודל הטעות האפשרית מתוך אחוז הבלתי מחליטים. אם האחוז גדול, כמו בבחירות הנוכחיות בהן הוא עדיין קרוב ל30%, ההבדל שנובע משיטות הפילוח השונות יכול להיות גדול. במקרה זה צריך להתייחס בספקנות ראויה לכל התוצאות. כאשר אחוז זה יקטן, בטחוננו בתוצאות החיזוי יגדל.

לכן, בראותכם סקר בחירות שאלו מי מימן, מי ערך ומתי; מי נשאלו ומה; כמה סרבו להשיב, מהי טעות הדגימה וכמה עדיין מתלבטים; זאת על מנת להעריך את ערכו.
איך תדעו? לצערנו הדבר בלתי אפשרי. למרות שחוק תעמולת הבחירות מחייב לתת כמעט את כל המידע הזה עם פירסום או דיווח על תוצאות הסקר בעיתונות הכתובה והמשודרת, המציאות רחוקה מכך. במעקב חלקי של קבוצת מתנדבים מהאיגוד הישראלי לסטטיסטיקה התקבלה תמונה עגומה ביותר. לדוגמא, שני פרסומי הסקרים בטלביזיה שהזכרנו נתנו רק את המידע על עורכי הסקר ותחזית המנדטים ואפילו טעות הדגימה הושמטה, למרות שבאחד מהערוצים דנו בפער בין התחזיות. אפילו עיתון זה, שמתקרב ביותר לפירסום מלוא המידע הדרוש, לא נותן מידע על אחוז המסרבים להשיב.

על אמצעי התקשורת לשנות את דרך פירסום תוצאות הסקרים כבר במערכת בחירות זו. גם לוועדת הבחירות המרכזית תפקיד להבהיר את החובה במילוי החוק. עד אז, וגם לאחר מכן, התייחסו בזהירות הדרושה להשענות על תוצאות הסקרים בקביעת החלטתכם למי להצביע.

פרופ' יואב בנימיני
נשיא האיגוד הישראלי לסטטיסטיקה

לראות עד כמה החדשות לא מראות לנו

אליסה מילר הרצתה בטד (פחות מ- 4:30 דקות), והציגה את מפת העולם, לפי כמות הדקות של סיקור תקשורתי שכל מדינה קיבלה.
רק כ- 12% מזמן החדשות של ערוצים בארה"ב מוקדש לחדשות מהעולם. ערוצי החדשות בארה"ב הורידו ב- 50% את המחלקות של חדשות החוץ.
אלו, ועוד ערימה של מספרים, מוצגים בדרך וויזיואלית שמעבירה היטב את השאלה: האם התקשורת יוצרת את "ידע-העולם" שהיינו רוצים, בתרבות האמריקאית (שמתגאה בהיותה החזקה בעולם, ובעלת המודעות הגדולה ביותר ליחסים בינלאומיים).
ובכן, התשובה היא כמובן שלא, אבל מה שמעניין זה ההעברה של התשובה הזו.
צפייה נעימה:

מילה על סקר התמיכה ב- 892. וקליפ על "מהו האינטרנט?/ווב2.0/המכונה ואנו"

תרבות האינטרנט הישראלית קרבה לנקודת צומת מעניינת/מפחידה/מרגשת. באחרונה עבר חוק-סינון-האתרים (892) קריאה ראשונה בכנסת.
ואילו היינו שואלים אחד מ-46 נבחרי הציבור שהצביעו בעד החוק "למה הצבעת כך ?".
ייתכן והוא היה עונה לנו: "כי הסטטיסטיקה אומרת ש 56% מהאוכלוסייה הבוגרת בישראל תומכים בחוק סינון אתרים בעלי תכנים פורנוגרפיים.

ופה אני נכנס ושואל – מה בעצם הסטטיסטיקה הזו אמרה לנו ? האם היא אומרת ש- 56% מהאנשים באוכלוסיה היו רוצים ש- 892 יעבור?
התשובה שלי היא שאני לא יודע. ושגם חברי הכנסת לא יודעים.
בשביל שנבין מהי המשמעות של הסקר, יהיה עלינו לבחון את הסקר בצורה שקולה: להבין איך נבחרו המשיבים, כיצד הם משקפים את שאר מבנה האוכלוסיה, והכי חשוב – להבין מה בעצם הסקר שאל.
הניחוש שלי הוא שהסקר לא שאל "האם אתה רוצה ש- 892 יעבור?" אלא שאל "האם אתה מבין מספיק מה-זה-אינטרנט ?" (מספיק כדי להבין ש- 892 רע לתרבות האינטרנט בישראל, רע לדמוקרטיה ובנוסף לכל גם ייכשל בלהשיג את שהוא מנסה להשיג, אלא אם הוא ישפוך את התינוק עם המים).
והפרשנות שלי לתוצאות הסקר היא שאנשים שמשתמשים באינטרנט (בשביל אימיילים וקצת גלישה), עדיין לא הפנימו את מה שקרה פה בשנים האחרונות.
הסקר הנ"ל, שהעביר ערוץ הכנסת, עוד יקבל אצלי התייחסות מקיפה יותר (אבל לא היום). אך בינתיים:

בשביל האנשים שעוד-לא-הפנימו-מהו-אינטרנט, אני מצרף את הסרטון הבא (ותודה לאופיר כהן על הלינק).
הסרטון הוא באורך של 4:30 דקות, והצפייה בו ריגשה אותי מאד. הקליפ כותב, וממחיש כיצד עוד ועוד צורות חשיבה התפתחו: בדרך שבה אנו עובדים עם טקסט, מציגים טקסט, מקשרים טקסט, כותבים על טקסט, מפיצים טקסט. ובעצם, לא רק טקסט – אלא גם אודיו ווידיאו. ובעצם, לא רק אותם – אלא את עצמנו. והכל מלווה במוזיקת רקע מתאימה. תהנו:

Web 2.0 … The Machine is Us/ing Us

סטטיסטיקה טעימה – הסטוגרמה של מרכיבים פופולריים במתכוני מרקים

פרוייקט בוחשים בקלחת, של תופינים ובצק אלים. הגיע לסיומו.
מדובר בפרוייקט כתיבה קבוצתית בבלוגוספירה, שבו כל בלוג מציע את מתכון הבית שלו למרק, ובסוף כולנו נהנים ממתכונים וקישורים.
בפוסט הסיכום לפרוייקט המרקים , מאיה הפליאה לעשות והביאה הסטוגרמה להתפלגות הירקות המשמשים להכנת מרקים. כל כך נהניתי מהגרף, שאני מצרף אותו כאן להנאתכם:
סטטיסטיקת מרכיבים במרקים
רוצים מתכונים – רוצו לפוסט הסיכום של פרוייקט המרקים.

glTail.rb – כלי חינמי לויזואליזציה, בזמן אמת, של ביקורי גולשים לאתרים שלכם

הכלי מאפשר להציג וויזואליזציית זמן אמת של נתוני שימוש בשרת אינטרנט, לפי נתוני הלוג של השרת.
בקליפ שמיד אציג לכם, אפשר לראות שפריצים של בועות מימין ומשמאל. כל בועית משמאל, מייצגת כניסה לאתר. גודל הבועית מייצג כמה זמן לקח כדי להציג את הדף (לפי עומס השרת וגודל העמוד שהגולש ביקש לראות וכו'), צבע הבועית מציין לאיזה אתר נכנס הגולש.
בועיות מצד ימין מייצגות מי האתר שהפנה אלינו את הגולש.
את התוכנה ניתן להוריד מכאן.
את הקליפ שאציג מיד, ניתן להוריד באיכות גבוה מכאן.

ואם למישהו יש מושג איך אפשר להתקין דבר כזה על גו-דדי, בבקשה תספרו לי 🙂