הומאופתיה לא עובדת – תרשים זרימה של טיעונים נפוצים
פורסם בתאריך 25 פברואר, 2013
נושאים אפידמיולוגיה, סטטיסטיקה וניסויים | השארת תגובה
הומאופתיה היא קישקוש. היא לא עובדת, היא לא "בערך" עובדת, היא גם לא עובדת "לפעמים". היא פשוט לא עושה שום דבר מעבר למקריות ולאפקט הפלאסבו (לפי מכלול מאד מאסיבי של ראיות אשר הגיעו ממחקרים מדעיים מאד מושקעיים, יותר ממה שלדעתי הגיע לתחום הפסאבדו-רפואי הזה).
אם אתם קוראים קבועים של הבלוג הזה, רוב הסיכויים שאתם מסכימים עם מה שכתבתי. עם זאת, סביר להניח שחלק מחבריכם לא מסכימים איתכם. במקרה כזה, יש סידרה של טיעוני נגד (יותר מידי) נפוצים אשר אתם צפויים להיתקל בהם, באם תאמרו לחבריכם את דעתכם על הומאופתיה.
כדי לחסוך לכם (ולי) זמן, גלעד דיאמנט עשה את מלאכת הקודש (או הדבר הכי קרוב לזה, עבור אתאיסט גמור), של לרכז את סידרת הטיעונים בעד (ואז נגד) האפקטיביות (כביכול) של הומאופתיה. אתם מוזמנים להפיץ את התרשים בפייסבוק, בבלוג שלכם, באימייל, לחברים, או לתלות עותק מודפס בחדר הישיבות של המשרד. אני לא חושב שזה ישנה את דעתם של מאמינים כבדים, אבל זה עשוי "לחסן" מוחות צעירים מהפיתוי של אמונות שווא. הנה התרשים (ניתן ללחוץ עליו לגירסה מוגדלת)
התרשים הופיע במקור בבלוג "חשיבה חדה" בפוסט על הומאופתיה אשר כולל הרבה קישורים וסרטונים שימושיים. הנה רק אחד מאותם סרטונים חביבים (3 דקות על מה זה הומאופתיה, וכיצד מבצעים ניסויים אשר בוחנים את ההומאופתיה):
הבחירות לכנסת ה- 19 (בשנת 2013) – איפה הסקרים הצליחו ואיפה הם כשלו?
פורסם בתאריך 23 ינואר, 2013
נושאים סטטיסטיקה, סטטיסטיקה בתקשורת, סטטיסטיקה על העולם | השארת תגובה
הבחירות הסתיימו, אני הצבעתי, ועכשיו כשהאבק מתחיל לשקוע אנו יכולים להתרווח ולבדוק את הקשר בין תחזיות הסקרים לתוצאות בשטח. יש דרכים רבות לדון בשאלות הללו, מה שבחרתי לעשות היום זה לקחת את הסקר של פרופסור קמיל פוקס (דיאלוג), שהתפרסם חמישה ימים לפני הבחירות לכנסת ה- 19 (אשר התקיימו ב- 22.01.2013), בעיתון הארץ (קישור לתוצאות הסקר) ולענות על כמה שאלות:
- עד כמה קרובים היו תחזיות הסקר לתוצאות האמת?
- האם 19 המנדטים שקיבלה "יש עתיד" היו בתוך טווח הטעות הסבירה או לא?
- האם לארץ חדשה היה סיכוי לעבור את אחוז החסימה?
- האם יש עדות מובהקת לכך שהסקרים של הארץ מוטים לכיוון השמאל-מרכז?
הפוסט הזה יכלול את עיקרי הדברים (אפשר לקפוץ לסוף הפוסט לריכוז המסקנות), ואם תרצו לראות את החישובים המדוייקים, אתם מוזמנים להוריד את המסמך מהקישור שכאן.
מטוס עם מאה מקומות ישיבה מסומנים – חידה קטנה בהסתברות
פורסם בתאריך 1 דצמבר, 2012
נושאים הסתברות, לסטודנטים | השארת תגובה
חבר שלח לי חידה נחמדה שחשבתי לחלוק איתכם:
יהי מטוס עם מאה מקומות ישיבה מסומנים.
הנוסע הראשון נכנס למטוס, מגלה שאיבד את כרטיס הטיסה שלו ולכן מתיישב באופן אקראי באחד ממאה המושבים.
כל נוסע שמגיע אחריו (שני ועד לאחרון) פועל באופן הבא: אם מקומו נתפס כבר, הוא בוחר באקראי מקום פנוי מאלו שנותרו, ואם מקומו פנוי הוא מתיישב בו.
השאלה היא מה הסיכוי שהנוסע האחרון (המאה) ישב במקומו?
התשובה לחידה היא:
להמשך
טילים על ישראל | פלסטינים שנהרגו בידי צה"ל — בין השנים 2002 ל- 2012 – גרפים, נתונים, ומחשבות
פורסם בתאריך 16 נובמבר, 2012
נושאים אירוע, ויזואליזציה, סטטיסטיקה בתקשורת, סטטיסטיקה על העולם, סטטיסטיקה תיאורית, סטטיסטיקה תיאורית | 3 תגובות
הערת הקדמה לקוראים וותיקים וחדשים: הפוסט הזה הוא מאד בסיסי מבחינת הסטטיסטיקה שבו (לטוב ולרע). עיסוקו הוא יותר במציאת נתונים והסתכלות בסיסית עליהם מאשר ניתוחים מורכבים.
חסרי סבלנות לקרוא את הפוסט? פשוט תסתכלו על הגרף שכאן (מספר הטילים על ישראל מול פלסטינים שנהרגו בידי צה"ל – לאורך זמן):
רוצים להבין למה יצרתי את הגרף הזה, באיזה נתונים השתמשתי (מופיעים בסוף הפוסט), ומה אני חושב עליו? תמשיכו לקרוא הלאה…
עידכון (18.11.2012): יצרתי להנתאכם גירסה דינמית של גרף הנתונים, כנסו לפוסט בשביל לצפות בו:
אנשי R (בהווה ובעתיד) – בואו ניפגש
פורסם בתאריך 21 אפריל, 2012
נושאים אינטרנט, אירוע | השארת תגובה
על R ועלי: אלו מיכם שמכירים אותי אישית יודעים שאני שהאהבות הגדולות שלי בחיים (שאינם בני אדם) זה מידע פתוח, קוד פתוח, אינטרנט וסטטיסטיקה. את כל אלו אני זוכה (בצורה כזו או אחרת) לשלב דרך שפת R. R זו סביבת פיתוח, ושפת תכנות, המיועדת לתכנות סטטיסטי. התוכנה מפותחת ומופצת בקוד פתוח ומאפשרת אינספור שימושים והרחבות.
קהילות R בעולם: באופן דומה לפרוייקטים אחרים כמו ויקפדיה וורדפרס, הפרוייקט המונומנטלי שהוא R מצליח בזכות אינספור מתכנתים וסטטיסטיקאים אשר משפרים את המערכת עוד ועוד. הקהילה של משתמשי R היא קהילה חובקת עולם עם קבוצות אשר נפגשות בערים גדולות ברחבי העולם. קבוצות מקומיות של משתמשי R מכונות גם RUG (R user group). יש רשימה של קבוצות כאלה כאן, ויש גם בלוג עם הרצאות מוקלטות ממפגשי R ברחבי העולם (כאן).
קהילת R בישראל? ומה לגבי ישראל? בישראל יש קבוצת דיון של משתמשי R בגוגל גרופס אשר הוקמה על ידי יונתן רוזנבלט (תודה יונתן!). וגם היו שני סדנאות על R במהלך שנת 2012, אשר אורגנו על ידי איגוד הסטטיסטיקאים הישראלים (קישור). אבל זה עדיין לא קהילה.
בואו ניפגש: כדי שנהפך להיות קהילת משתמשי R בישראל, אנחנו צריכים להיפגש ולהכיר. רצוי באופן קבוע יחסית (פעם בחודש עד 4 חודשים?). מה שמוביל אותי למטרת הפוסט. אם אתם מעוניינים להיפגש עם אנשי R, אנא השאירו את פרטיכם בטופס הזה (הטופס ממוקם באתר חדש שהוקם לצורך ריכוז מידע עבור הקהילה שתתהווה). אחרי שהטופס יתחיל להתמלא, אני אוכל לקבל מושג על מי עוד "נמצא שם". ולפי זה אפשר יהיה להתחיל לתכנן מפגשים (בהתאם לרקע של האנשים שירשמו), ולגלגל את הכדור הלאה…
רצינות הבלוגר: רק כדי להבהיר שאני רציני לגבי הפוסט הזה – 1) הייתי בין המארגנים של שני כנסי קוד פתוח (וורדקמפ 2007 וורדקמפ 2008). ביוני הקרוב אני מתכנן לטוס לארה"ב לכנס useR!2012 הבינלאומי, אני מניח שבאחד ממפגשי ה- R הקרובים אני אתן הרצאה על דברים מעניינים שאגלה שם. וגם תודה לשלמה יונה (מאאוטבריין) אשר דחף אותי לקדם את הנושא, ומסייע מאד בצד הלוגיסטי והרוחני.
כך זינק המס שאנחנו משלמים על הדלק?!
פורסם בתאריך 31 מרץ, 2012
נושאים דיסאינפוגרפיקה, ויזואליזציה, סטטיסטיקה בתקשורת, סטטיסטיקה על העולם | השארת תגובה
באולפן שישי מהימים האחרונים (30.03.2012), התנוססה לה כתבה תחת הכותרת "כך זינק המס שאנחנו משלמים על הדלק". בכתבה מופיע תרשים מרשים המראה את הטיפוס הבלתי נלאה של המס שאנחנו משלמים על הדלק בעשור האחרון. היות והרבה חברים בפייסבוק החליטו להפיץ את התרשים הזה, החלטתי להסתכל עליו קצת יותר, הנה הוא:
בתרשים הזה יש שני כשלים משמעותיים: הראשון הוא מבחינה עיצובית (תרשים עמודות תלת מימדי, במקום דו מימדי) והשני הוא מבחינת סוג הנתונים שהוצגו (נתונים גולמיים ללא תיקנון). וכעת הסבר מורחב:
תרשים של מחירי דירות בשנתיים האחרונות – אני לא רואה בשורות גדולות – ואתם?
פורסם בתאריך 28 מרץ, 2012
נושאים ויזואליזציה, סטטיסטיקה בתקשורת, סטטיסטיקה על העולם | השארת תגובה
מדור הכלכלה של ווינט פירסם לפני כמה שעות את הנתונים שפרסם היום משרד הבינוי והשיכון.
המממ, כשאני אומר "פירסם", כוונתי היא שהעיתון נתן צילום מסך של טבלת נתונים, ביחד עם תיאור של היחס בין מחירי הדירות בתאריכים שונים (דהיינו, הירידה באחוזים).
אז מה הפריע לי? שלהסתכל על (צילום מסך) של טבלת נתונים גדולה לא ממש עוזר לי להבין מה קורה בשוק הדיור (ותיאור האחוזים של הכתבה גם כן לא עוזר).
הכנת הנתונים
רציתי ליצור תרשים של הנתונים. בשלב הראשון, הורדתי את התמונה של טבלת הנתונים מהאתר של ווינט (קישור) . בשלב השני נגשתי לגוגל וחיפשתי "OCR jpg to doc", כדי למצוא אתר שיאפשר לי להמיר את התמונה למספרים (כדי שאני לא אצטרך להתאמץ יותר מידי בהקלדה). הנה קישור לאתר שהצליח לא רע להמיר את התמונה למסמך וורד (קישור). את הטבלה שבקובץ וורד העברתי לאקסל, ותיקנתי כל מיני שגיאות (פסיקים, נקודות, ואפסים חסרים).
אתם מוזמנים להוריד את הקובץ שהתקבל ולחשוב על דברים יצירתיים אחרים לעשות איתו (קישור לקובץ הנתונים).
התרשים של מחירי הדירות בשנתיים האחרונות
מה שמצער אותי זה שאני לא מבין את המשמעות המדוייקת של המחיר. אני לא יודע אם זה מחיר ממוצע לדירה בגודל מסויים. באיזה איזורים בארץ, וכן הלאה. המשמעות המדוייקת של הנתון לוטה בערפל, לא מתואר בכתבה של ווינט, ודורש חפירה באתר של משרד השיכוי והבינוי (וזה בהנחה שהם רשמו את ההסבר שם איפשהו).
אבל בואו נניח שהנתון הזה בכל זאת מייצג משהו על מה שקורה בארץ. הנה התרשים:
הקו הכחול הוא של מחירי דירות יד שניה, בעוד שהקו האדום הוא של מחירי דירות חדשות. הקו השחור שהוספתי על גבי הנתונים הוא החלקה על פני 4 תקופות (אפשר לחשוב על זה כעל קו המגמה "הממוצע" של מחירי הדירות).
מחשבות על הנתונים (ומחאת האוהלים)
כמה תופעות מעניינות צצות כשמסתכלים על הגרף:
- מחירי הדירות הם נתון "רועש" בין חודש לחודש (שזה די מרשים לראות כשחושבים על זה שמדובר בממוצע של מחירים). אחת המסקנות שמתקבלות מזה היא שלהשוות חודש ספציפי עם חודש ספציפי בשנה שלפני כן, זה לא בהכרח ההשוואה הכי טובה. מדוע? כי ייתכן שבמקרה (או בכוונה שאיננה "נקיית כפיים") נבחר להשוות שני חודשים עבורם היה הפרש גדול. וייתכן וההפרש הזה הוא מיקרי, ויהיה מתון יותר בחודש שלאחר מכן. זה אומר שלשם השוואות בין תקופות, ייתכן ועדיף להסתכל על נתונים שעברו "החלקה" (דהיינו, "מיצוע", מה שמופיע בתרשיימים למעלה בתור הקו השחור).
זה גם אומר שיכול להיות חודש שבו פתאום יכריזו ש"מחירי הדירות מתרסקים" (בעיקר כאשר מדובר במחירי הדירות החדשות), אבל שחודש לאחר מכן המחירים שלהם יתאזנו חזרה למחירים הקודמים. - נראה שיש יותר תנודתיות במחירי הדירות החדשות לעומת מחירי הדירות יד-שניה (זה רק מהסתכלות בעין, לא בהכרח מדובר בהבדל מובהק סטטיסטית). הסבר אחד על כך נתן אוהד דנוס, יו"ר לשכת שמאי המקרקעין, אשר אמר בעקבות פרסום הנתונים כי "הודעת משרד השיכון תואמת אחת לאחת את תחזיות לשכת השמאים בדבר ירידת מחירים זמנית, בשיעורים מינוריים, כשהקבלנים מוכנים להתפשר מעט יותר משוק דירות היד השנייה, וזאת רק הממונפים שבהם".
- מאז תחילת מחאת האוהלים (דהיינו, יולי 2011), נראה שהייתה "ירידה" במחירי הדירות החדשות והיד-שניה (בהשוואה לשיא). אם כי הירידה היא על פני המגמה, יותר משמעותית בדירות החדשות – ובכל מקרה די זעומה ביחס לשונות הכללית של הנתונים. האם הנתונים האלה מלמדים אותנו שמחאת האוהלים השפיע על שוק הדיור והורידה את מחיריו? זו שאלה מצויינת, אינני יודע את התשובה. ייתכן ומחאת האוהלים הגיע באותו הזמן שהתחילה להתהפך מגמת העלייה של מחירי הדיור.
בשורה התחתונה, אני לא רואה בשורה גדולה בנתונים האלה, רק קצת תובנות שלא ברור לי מה אפשר לעשות איתן.
אם יש לכם מחשבות על מה לעשות עם הנתונים, או איך לפרש אותם – אשמח לקרוא עליהם בתגובות, אני אוהב ללמוד דברים חדשים…
מחירי החשמל עולים, אבל לא ככה – ביקורת על גרפיקה מהעיתון
פורסם בתאריך 23 מרץ, 2012
נושאים ויזואליזציה, סטטיסטיקה בתקשורת | תגובה אחת
דף הפייסבוק של ידיעות אחרונותפירסם הודעה עם הגרף שמתחת, ומעליו הטקסט הבא:
התעצבנתם מחשבון החשמל המנופח? כשתקבלו את החשבון הבא תתעצבנו עוד יותר. כתבנו עמיר בן-דוד מדווח כי תעריפי החשמל יעלו בשבוע הבא בעוד 8.9%, ובכך ישלימו זינוק של 24% בתוך שנה. תראו כמה שילמתם אז – וכמה אתם עומדים לשלם עכשיו
אין ספק שכעס זה דבר שמושך תשומת לב של קוראים, ועלייה במחירי החשמל בפירוש עונה על הקריטריון הזה. אבל רגע, האם אתם שמים לב לאיזושהי בעיה בגרף שלמעלה? להמשך
רגישות, סגוליות וערכי ניבוי – למה כדאי שכולכם תדעו את זה (וגם איך מחשבים)
פורסם בתאריך 30 נובמבר, 2011
נושאים אפידמיולוגיה, לסטודנטים, סטטיסטיקה, סטטיסטיקה תיאורית | 7 תגובות
למה כדאי שכולכם תרפרפו על המאמר שכתבתי? (כלומר – למה כדאי שתפיצו את המאמר הזה לחבריכם)
כי כל פעם שאתם ניגשים לבדיקה רפואית שמחליטה האם אתם "בריאים" או "חולים" – כדאי שתדעו לשאול מהו הערך המנבא החיובי ומהו הערך המנבא השלילי. מדוע? כדי שתבינו, בהינתן שהובחנתם כבריאים/חולים – מה הסיכוי שההבחנה שקיבלתם באמת מתארת את המציאות.
ביום שבו תצטרכו להבין את זה (וזה יגיע), כדאי שתזכרו את המאמר הזה – ותקראו אותו טוב (בניגוד לריפרוף הראשוני שבו אתם בטח תקראו אותו כעת).
בפוסט שלפניכם אני מתחיל מלהסביר (לאט לאט) מה זה "רגישות", "סגוליות" ואז עובר להסביר מה זה "ערך מנבא חיובי ושלילי". אני מראה כיצד השתמשתי בכל המונחים הללו כדי לחלץ את התשובה לשאלה: "בהינתן שאישה עברה ממוגרפיה והובחנה כחולת סרטן השד – מהי ההסתברות שבאמת יש לה סרטן השד?" (התשובה מופיעה בסוף הפוסט)
ונתחיל….
הזמנה לערב הרצאות (כולל אחת שלי) לכבוד יום הסטטיסטיקה הבינלאומי
פורסם בתאריך 3 נובמבר, 2011
נושאים אירוע | השארת תגובה
ב-14.11.2011 יתקיים ערב בן 5 הרצאות קצרות שיסקרו את נושא הסטטיסטיקה מכיוונים שונים לכבוד יום הסטטיסטיקה הבינלאומי (שכבר התקיים ב-20.10.2011).
התכנסות בשעה 20:00, ההרצאות יחלו ב-20:30. האירוע יערך בפאב גורדו (נראה שהכתובת היא הירקון 121, חוף גורדון, טיילת תל אביב)
ניתן להרשם ולהפיץ לחבריכם או שונאיכם באמצעות האירוע בפייסבוק.
10 ש"ח דמי השתתפות לכיסוי הוצאות לוגיסטיות.
אני אתן בערב את ההרצאה "כיצד חוקרים עכברים שחוקרים את סביבתם", הנה התקציר:
יום אחד עכבר קם בבוקר, מחליט שהוא סקרן, ומתחיל ללכת. לאן הוא הולך? מתי הוא חוזר? כמה הוא מטייל? האם הוא מתרגש? ולמה זה בכלל מעניין אותנו (כחוקרים) לדעת?
טל גלילי, הוא דוקטורנט לסטטיסטיקה באוניברסיטת תל אביב, אוהב קוד פתוח ומידע חופשי, ובלוגר במדריך לטרמפיסט בסטטיסטיקה.
כנסו לאתר הספקנים בפאב, בשביל פירוט של שאר ההרצאות שיתקיימו בערב. שאר ההרצאות יתקיימו על ידי אנשים מעניינים ומקצועיים בתחום הסטטיסטיקה, יהיה מעניין…
להתראות שם,
טל.





