ארכיון הקטגוריה: אירוע

רשמים מכנס useR!2014

photo (1)

שבוע שעבר נהניתי להשתתף בכנס useR!2014 אשר התקיים באוניברסיטת UCLA בקליפורניה, ארה"ב. הכנס הוא המפגש השנתי של אנשי קהילת ה- R מרחבי העולם, כשהשנה השתתפו בו כ-700 אנשים מהקהילה. (למי שלא מכיר, R היא שפת תוכנה, בקוד פתוח, לתכנות סטטיסטי). אם לסכם, אומר שמדובר היה בחוויה מדהימה. זו הפעם החמישית שאני משתתף בכנס הזה, ומבין כל הכנסים המקצועיים שהיו בחיי, אין ספק שכנסי ה- useR הם הכי מספקים מבחינתי (ברמה המקצועית, האינטלקטואלית, והרגשית). מעבר לתוכן העיוני, הפתיחות והחברותיות של האנשים בקהילת ה- R, היא בדיוק סוג הדברים להם אפשר לצפות במפגשים של תוכנת קוד פתוח.

אם R קרוב לליבכם, אפילו אם אתם בתחילת דרככם, אני מעודד אתכם לעשות מאמץ ולהגיע למפגש useR!2015 אשר יתקיים שנה הבאה בדנמרק (ובמקרה שתעשו כן, אנא שלחו לי מייל – tal.galili@gmail.com, אשמח לדעת שאתם מגיעים).

בשאר הפוסט אני אציף נקודות שעלו לי סביב הכנס. אני לא ממש אלמד אף אחת מהן, ואני גם לא אסקור את כל מה שהיה. אבל אני מקווה שמשהו מזה תמצאו מעניין. להמשיך לקרוא

טילים על ישראל | פלסטינים שנהרגו בידי צה"ל — בין השנים 2002 ל- 2012 – גרפים, נתונים, ומחשבות

הערת הקדמה לקוראים וותיקים וחדשים: הפוסט הזה הוא מאד בסיסי מבחינת הסטטיסטיקה שבו (לטוב ולרע). עיסוקו הוא יותר במציאת נתונים והסתכלות בסיסית עליהם מאשר ניתוחים מורכבים.

חסרי סבלנות לקרוא את הפוסט? פשוט תסתכלו על הגרף שכאן (מספר הטילים על ישראל מול פלסטינים שנהרגו בידי צה"ל – לאורך זמן):

רוצים להבין למה יצרתי את הגרף הזה, באיזה נתונים השתמשתי (מופיעים בסוף הפוסט), ומה אני חושב עליו? תמשיכו לקרוא הלאה…

עידכון (18.11.2012): יצרתי להנתאכם גירסה דינמית של גרף הנתונים, כנסו לפוסט בשביל לצפות בו:

להמשיך לקרוא

אנשי R (בהווה ובעתיד) – בואו ניפגש

על R ועלי:  אלו מיכם שמכירים אותי אישית יודעים שאני שהאהבות הגדולות שלי בחיים (שאינם בני אדם) זה מידע פתוח, קוד פתוח, אינטרנט וסטטיסטיקה. את כל אלו אני זוכה (בצורה כזו או אחרת) לשלב דרך שפת R. R זו סביבת פיתוח, ושפת תכנות, המיועדת לתכנות סטטיסטי. התוכנה מפותחת ומופצת בקוד פתוח ומאפשרת אינספור שימושים והרחבות.

קהילות R בעולם:  באופן דומה לפרוייקטים אחרים כמו ויקפדיה וורדפרס, הפרוייקט המונומנטלי שהוא R מצליח בזכות אינספור מתכנתים וסטטיסטיקאים אשר משפרים את המערכת עוד ועוד. הקהילה של משתמשי R היא קהילה חובקת עולם עם קבוצות אשר נפגשות בערים גדולות ברחבי העולם. קבוצות מקומיות של משתמשי R מכונות גם RUG (R user group). יש רשימה של קבוצות כאלה כאן, ויש גם בלוג עם הרצאות מוקלטות ממפגשי R ברחבי העולם (כאן).

קהילת R בישראל?  ומה לגבי ישראל? בישראל יש קבוצת דיון של משתמשי R בגוגל גרופס אשר הוקמה על ידי יונתן רוזנבלט (תודה יונתן!). וגם היו שני סדנאות על R במהלך שנת 2012, אשר אורגנו על ידי איגוד הסטטיסטיקאים הישראלים (קישור). אבל זה עדיין לא קהילה.

בואו ניפגש: כדי שנהפך להיות קהילת משתמשי R בישראל, אנחנו צריכים להיפגש ולהכיר. רצוי באופן קבוע יחסית (פעם בחודש עד 4 חודשים?). מה שמוביל אותי למטרת הפוסט. אם אתם מעוניינים להיפגש עם אנשי R, אנא השאירו את פרטיכם בטופס הזה (הטופס ממוקם באתר חדש שהוקם לצורך ריכוז מידע עבור הקהילה שתתהווה). אחרי שהטופס יתחיל להתמלא, אני אוכל לקבל מושג על מי עוד "נמצא שם". ולפי זה אפשר יהיה להתחיל לתכנן מפגשים (בהתאם לרקע של האנשים שירשמו), ולגלגל את הכדור הלאה…

רצינות הבלוגר: רק כדי להבהיר שאני רציני לגבי הפוסט הזה – 1) הייתי בין המארגנים של שני כנסי קוד פתוח (וורדקמפ 2007 וורדקמפ 2008). ביוני הקרוב אני מתכנן לטוס לארה"ב לכנס useR!2012 הבינלאומי, אני מניח שבאחד ממפגשי ה- R הקרובים אני אתן הרצאה על דברים מעניינים שאגלה שם. וגם תודה לשלמה יונה (מאאוטבריין) אשר דחף אותי לקדם את הנושא, ומסייע מאד בצד הלוגיסטי והרוחני.

 

הזמנה לערב הרצאות (כולל אחת שלי) לכבוד יום הסטטיסטיקה הבינלאומי

ב-14.11.2011 יתקיים ערב בן 5 הרצאות קצרות שיסקרו את נושא הסטטיסטיקה מכיוונים שונים לכבוד יום הסטטיסטיקה הבינלאומי (שכבר התקיים ב-20.10.2011).

התכנסות בשעה 20:00, ההרצאות יחלו ב-20:30. האירוע יערך בפאב גורדו (נראה שהכתובת היא הירקון 121, חוף גורדון, טיילת תל אביב)

ניתן להרשם ולהפיץ לחבריכם או שונאיכם באמצעות האירוע בפייסבוק.

10 ש"ח דמי השתתפות לכיסוי הוצאות לוגיסטיות.

אני אתן בערב את ההרצאה "כיצד חוקרים עכברים שחוקרים את סביבתם", הנה התקציר:

יום אחד עכבר קם בבוקר, מחליט שהוא סקרן, ומתחיל ללכת. לאן הוא הולך? מתי הוא חוזר? כמה הוא מטייל? האם הוא מתרגש? ולמה זה בכלל מעניין אותנו (כחוקרים) לדעת?
טל גלילי, הוא דוקטורנט לסטטיסטיקה באוניברסיטת תל אביב, אוהב קוד פתוח ומידע חופשי, ובלוגר במדריך לטרמפיסט בסטטיסטיקה.

כנסו לאתר הספקנים בפאב, בשביל פירוט של שאר ההרצאות שיתקיימו בערב. שאר ההרצאות יתקיימו על ידי אנשים מעניינים ומקצועיים בתחום הסטטיסטיקה, יהיה מעניין…

להתראות שם,
טל.

אינפוגרפיקה על ישראל היום ומחאת האוהלים

מחאת האוהלים אשר החלה ברוטשילד מצליחה לסחוף עוד ועוד אזרחים, לצלילי הדממה החברתית שפקדה את מדינתנו בעשורים האחרונים.

ובהזדמנות זו, המחאה גם מצליחה לעורר דיון באופן שבו ערוצי התקשורת המרכזיים מסקרים את המחאה. מה שמוביל אותנו, תאמינו או לא, לסטטיסטיקה.
נתקלתי באינפוגרפיקה המקסימה, אשר משווה את שטח ההתייחסות שכל אחד מהעיתונים המרכזיים (ידיעות, מעריב וישראל-היום) הקדישו למחאת האוהלים בשבוע האחרון.
לחצו על התמונה לגירסה מוגדלת:

מחאת האוהלים - סיקור בתקשורת - אינפוגרפיקה
(קרדיט: לגרפיקאי ליאור צור – misquote. כל הכבוד!)

התמונה מראה את העמוד הראשי של כל אחד משלושת העיתונים לאורך השבוע, וצובעת בורוד את ההופעה של התייחסות למאבק האוהלים. לקינוח, ציטוטים נבחרים מעמוד השער מוצגים לצד התמונה בצהוב.
האם ישראל היום מתייחס פחות למחאת האוהלים מאשר עיתונים אחרים, בהחלט. האם זה מעיד על כך שמדובר ב"ביטאון של ביבי"? בשביל הפרשנות הזו צריך איש תקשורת, לא סטטיסטיקאי… 🙂

העונת נוספת: למרות נסיונות של גורמים כאלה ואחרים לצבוע את המחאה כקיטוב בין מחנות הימין והשמאל הפוליטיים (כפי שאלו מתבטאים בדעות על הסכסוך הישראלי פלסטיני), הרי שהיטיבו לכתוב לפני שמה שבאמת מדובר פה זו הכלכלה, וספציפית, האם אנו שואפים למדינה קפיטליסטית או מדינה המקדמת אג'נדה כלכלית שהיא יותר סוציאלית.

למה הסטטיסטיקאי חצה את הכביש? כדי להפגין בשישי הקרוב נגד הומיאופטיה במערכת הבריאות!

Credit: xkcd (Dilution)

אם יש לכם רגע להתרחק מהאירועים (הכנראה היסטוריים) שמתרחשים ברגעים אלו במצרים, אז אתם מוזמנים להגיע ביום שישי הקרוב (4.2.11) בשעה 10:23 ולהפגין כנגד הומיאופטיה, בניצוחה של קהילת הספקנים בישראל (לחצו כאן לפרטים מלאים על ההפגנה).

שמעתי על ההפגנה דרך הקריאה לדגל בבלוגו של יוסי לוי. אני ממליץ לכם לקרוא את מה שיש ליוסי לומר על הומיאופטיה, אך לשירותכם אתמצת חלק מהעיקר בציטוט הבא:

חולים שפונים לטיפול הומיאופתי דוחים בכך טיפול רפואי מבוסס או מועיל, או אפילו מוותרים עליו. […]

צריך לעשות משהו, ואני וחבריי לקהילה הספקנית נעשה משהו.

אנו נצא למחות נגד הלגיטימציה שנותנות קופות החולים ורשתות הפארם לטיפולים ההומאופתיים חסרי הערך, ונקרא לציבור הרחב לבחון בשיקול דעת את התועלת והנזק הפוטנציאליים הטמונים בטיפול הומיאופתי לפני ההחלטה לפנות לטיפול כזה.

לא נהיה לבד. יחד עימנו ימחו אלפי אנשים בעשרות מדינות, במסגרת אירוע 10:23, אירוע מחאה גלובלי נגד ההומיאופתיה ונזקיה. אני גאה להיות חלק מהמחאה הזו. אשמח אם תצטרפו אליי,ביום שישי הקרוב, ה-4.2.2011, בשעה 10:23, בכיכר דיזנגוף בתל-אביב.

בשבילי, התגלית שישנם "ספקנים" שכמותי בישראל היא מרתקת, אז בהחלט ייתכן שאקפוץ לבקר שם. מה איתכם?

כנס לסטטיסטיקאים: "נושאים נבחרים בהנדסת שירות" – כניסה חינם בהרשמה מראש

הכנס הרביעי של הקבוצה הישראלית ליישומי סטטיסטיקה בתעשייה ובעסקים
יתקיים ביום שלישי, 30 בנובמבר 2010,
בבית חיל האויר – רח' ז'בוטינסקי 15, הרצליה.

לחצו כאן כדי להירשם

להל"ן תוכניית הכנס:

להמשיך לקרוא

יום עיון בנושא "יישומי סטטיסטיקה בשיווק"

אני אהיה שם.

הכנס השלישי של הקבוצה הישראלית ליישומי סטטיסטיקה בתעשייה ובעסקים – isENBIS

יום עיון בנושא "יישומי סטטיסטיקה בשיווק"

יום ראשון, י"א באייר תש"ע, 25 באפריל 2010

קריית האוניברסיטה הפתוחה ע"ש דורותי דה רוטשילד

אולם נוידרפר, דרך האוניברסיטה 1, רעננה

(הכניסה לחניה מרחוב ויצמן – צומת רעננה צפון; החניה ללא תשלום)

כניסה חופשית עם רישום מוקדם באתר http://www.kpa.co.il/isENBIS

15:00 – 14:30  התכנסות ורישום

מנחה: פרופ' דוד שטיינברג חוג לסטטיסטיקה וחקר ביצועים, בית הספר למדעי המתמטיקה, אוניברסיטת תל אביב

15:10 – 15:00 ברכות: פרופ' עירד בן גל, המחלקה להנדסת תעשייה, אוניברסיטת תל אביב,ד"ר יובל כהן, הנדסת תעשיה וניהול האוניברסיטה הפתוחה

15:40 – 15:10 רות לוריא, מנהלת המחקר, מחלקת השיווק הקמעונאי, קוקה קולה: "אם לא תשאל, איך תדע?"

16:10 – 15:40 ד"ר יובל כהן, ראש התוכנית להנדסת תעשייה וניהול, האוניברסיטה הפתוחה:"שיווק חבילות הנחה לקמעונאים עם ביקוש אקראי"

16:30 – 16:10 הפסקת קפה

17:00 – 16:30 פרופ' רון קנת KPA בע"מ, ואוניברסיטת טורינו, נשיא לשעבר של  ENBIS:"פעילויות מתוכננות של ENBIS"

17:30 – 17:00 מנו גבע, מנכ"ל מכון המחקר "מדגם" ויו"ר איגוד מכוני המחקר הישראלי:"סקרי דעת קהל ומחקרי שוק באינטרנט"

18:00 – 17:30 ד"ר דיאמנטה בנסוןקרעי, האוניברסיטה הפתוחה: "חיזוי חדירה לשוק של מוצרים חדשים בעלי עקומת ביקוש בצורת S באמצעות שיטת RMM (Response Modeling Methodology)"

פרטים והרשמה: KPA בע"מ, ת"ד 2525 רעננה 43100,

טל':  7408442 – 09, פקס': 7408443- 09  דוא"ל: info@kpa.co.il

ענת קם – הקשר בין עמדות פוליטיות לדעות על הפרשה

(אם הגעתם בשביל התוצאות, הם מופיעות בסוף הפוסט). כנסו לכאן אם ברצונכם למלא את השאלון ולהופיע שוב בניתוח המעודכן

רקע – ענת קם

חברי המלומד (והמתפלסף) טל ירון לקח על עצמו באחרונה לכתוב באריכות על ענת קם.
למי שלא הספיק להתעדכן, זה בסדר – אתם לא אמורים לדעת על זה.
ממה שהתפרסם בעיתונות ה"זרה", בארץ,  בטוויטר, בויקיפדיה (כלומר, הערך על ענת קם נמחק, אבל הדיון על המחיקה נשאר) ובבלוגוספירה בכלל (לדוגמא: פה, כאן, שם, וגם ב |||||, וגם זה וכמובן הוא וגם זה, ובטח שכחתי כמה…), נראה שהסיפור הוא ש (ואני מצוטט את טל ירון):
בהמלצת חברים – הסרתי את הטקסט עד להסרת צו איסור הפירסום

ענת קם, שהיתה חיילת בפיקוד מרכז, העבירה לאורי בלאו, כתב הארץ כאלף מכתבים, המסווגים סודי-ביותר. מתוך אלף המכתבים, הצליח הכתב אורי בלאו להשיג אישור מהצנזור לפרסם שני מכתבים. המכתבים מכילים פקודות שנתן יאיר נווה, אלוף פיקוד מרכז, לחיסול ממוקד של מבוקשים שלא לצורך, בניגוד להוראות בג"צ בעניין. ככל הנראה, מערכת הבטחון פעלה כדי לאתר את מקור המידע של בלאו. בדצמבר 2009, ענת קם, שהייתה כבר עיתונאית בוואלה, נתפסה. אורי בלאו, הכתב, ברח לבריטניה, כדי לחמוק מעדות במשפטה של קם. […]
החל מאוקטובר הוציאה מדינת ישראל (כנראה לבקשת השב"כ) בבית משפט השלום צו איסור פרסום על הפרשה.[…] אף עיתונאי לא הסכים לפרוץ את מעגל השתיקה […]. אבל הסוד לא נשמר זמן רב, מרגע שמספר בלוגרים לקחו על עצמם את היוזמה לפרסם את המידע. מרגע שזה קרה, הרשתות החברתיות התעוררו והתפוצצו במידע על הסיפור. והוא זכה לתפוצה רחבה מאד באינטרנט (חפשו בגוגל "ענת קם" ותראו כמה תוצאות תקבלו על הנושא).

(עידכון 8.4.2010: לינק למאמר בווינט בנושא)

רקע – סקר הדעות של הקוראים לגבי ענת קם

ומה בין זה לסטטיסטיקה?
ובכן, עושה רושם שהדעות בציבור לגבי הפרשה (שכמובן אף אחד לא שמע עליה), הן חלוקות. יש אנשים שהם בעד ענת קם ויש אלו שנגד, בעד אורי בלאו, ויש נגד, בעד יאיר נווה, ויש נגד.
ההגיון דורש שיהיה קשר בין העמדות הפוליטיות העקרוניות של האנשים לבין התפיסה שלהם את הפרשה המסויימת הזו. את הקשר הזה ביקש טל ירון לגלות באמצעות עריכת "סקר משפט ציבורי" בנושא של ענת קם וסביבותיה. נכון לרגע זה כ- 78 איש ענו על הסקר (אני, אגב, לא עניתי). ואת הניתוח הסטטיסטי של הסקר נתבקשתי לבצע – ואבצעו כאן כעת.

ניתוח סטטיסטי של הסקר

אז לפני שנפנה להציע ניתוח של הסקר, נאמר מילה על מה אפשר לקבל ממנו: הסקר לא מייצג נאמנה אף "קהל" מלבד קהל הקוראים של הבלוג של טל ירון. להניח שהקהל הזה איכשהו מייצג את האוכלוסיה הרחבה זה יהיה גוזמה לא ריאלית. גם הקשרים הסטטיסטיים שיתקבלו בין המשתנים עשויים להיראות אחרת אילו הסקר היה מוצג לאוכלוסיה הרחבה (ואני לא אכנס היום להסבר מדוע), מה שאומר שהסקר הזה הוא בעיקר לשם השעשוע, וקבלת התחושה הבסיסית של איך הקשרים בין המשתנים עשויים להיראות.

הסקר מורכב מארבע שאלות העוסקות בעמדות הפוליטיות של אנשים וב-5 שאלות העוסקות בדעות של האנשים על הפרשה של ענת קם.
טל ירון ביקש שהניתוח שלי יענה על שתי שאלות:
1) האם יש קשר בין השקפת העולם למצב גיבורי הסיפור
2) האם יש קשר למפלגה ולהשקפת העולם

כדי לענות על השאלות הללו, הרי שלא יעזור לנו הסתכלות חד ממדית על כל אחד מתשעת המשתנים שלנו (זה מה שגוגל מציע, וזה לא עוזר במיוחד לענות על השאלות).
אף על פי כן, הנה תוצאות הניתוח על פי גוגל (לחצו על התמונה לגירסה מוגדלת)

anat kam - google spraedsheet analysis - 1

אני לא התייחס בהרחבה לתוצאות הללו, אתם מוזמנים לעבור על התמונה ולהתרשם בעצמכם.

ניתוח סטטיסטי של הסקר – ניתוח דו-ממדי – שיקולים סטטיסטיים

כדי לענות על השאלה שטל ירון שאל, עלינו להשוות בין התוצאות במשתנה אחד לתוצאות באחר. אני אתחיל מלתאר כמה מהשיקולים בכלים הסטטיסטיים בהם השתמשתי ואז אציג את התוצאות.
הכלים בהם נשתמש כאן הם:
0) גוגל דוק – היכולת שלי לבצע את הניתוח הסטטיסטי הזה בזריזות ובקלות, מסתמך על זה שהנתונים נאספו (על ידי גוגל-טפסים) הישר לתוך גליון שאותו יכולתי לשאוב לתוך R (התוכנה הסטטיסטית האהובה עלי). כתבתי עוד על החיבור בין השניים בפוסט: Google spreadsheets + google forms + R = Easily collecting and importing data for analysis
1) קורלציות – אנחנו רוצים לראות מהי הקורלציה בין כל צמד משתנים. נשים לב שהיות והמשתנים שלנו הם קטגוריאליים סדורים, הרי שהקורלציה היותר מתאימה כאן היא זו של ספירמן (הא-פרמטרית) ולא זו של פירסון (שמתאימה לנתונים רציפים).
2) תרשימי פיזור – נשים לב שבמקרה שלנו תרשימי פיזור הם אתגר. מדוע? כיוון שכאשר מציגים תרשים פיזור עבור זוג משתנים עם 5 רמות בלבד, צפוי שנקבל הרבה נקודות שיעלו אחת על גבי השניה. ואז השאלה היא כיצד להציג מצב כזה. אני בחרתי לפתור זאת באמצעות שינוי גודל הנקודות (ככל שיש יותר נקודות במקום מסויים, כך גודל הנקודה המייצגת תהיה גדולה יותר). וגם, על ידי הוספה של קו מגמה מוחלק (LOWESS, למי שהיה סקרן לדעת).
3) השילוב הרב ממדי – השילוב של הצגת הרבה זוגות של השוואות (בהקשרנו) מתבצע על ידי גרף שנקרא "תרשים מטריצת-פיזור של קורלציות". הסברתי עוד כיצד אני מייצר את התרשים הזה ב- R בפוסט Correlation scatter-plot matrix for ordered-categorical data . אגב, נשים לב שבמקרה שמישהו לא ענה על אחת השאלות, החלטתי להסיר את התשובה שלו מהתרשים (המדקדקים היו ממלאים את הנתון שלו בנתון זמני, אבל החלטתי לוותר על זה ולהציג רק אנשים שהשיבו על כל השאלות. כמו כן, התעלמתי מסוגיית ההשוואות המרובות – עמכם הסליחה)
(הערה אחרונה – שימו לב שהניתוח שלי הצליח לשאוב את העברית של גוגל-מסמכים לתוך התוכנה R, ולהציג אותה בפלט. בהזדמנות קרובה אני אכתוב פוסט שבו הסברתי איך עושים זאת. אך לבינתיים תדעו שזה אפשרי וגם שזה לא טריוויאלי לעשות…)

ועכשיו, לתוצאות –
להמשיך לקרוא

האם (בארה"ב) למפגינים כנגד רפורמת הבריאות יש תפיסה מוטה של מיסוי במדינתם?

רקע (מקור: ויקיפדיה)

בארה"ב, החוק להגנת החולה וטיפול בר השגה (אנגלית: Patient Protection and Affordable Care Act) הוא חוק (חלק מרפורמת הבריאות) שנועד להסדיר מתן שירותי בריאות לתושבי ארצות הברית. החוק נועד למנוע את המצב בו עשרות מיליוני אמריקנים אינם מבוטחים, למנוע מאמריקנים שמבוטחים לאבד את ביטוח הבריאות שלהם עקב החלפת מקום העבודה דרכו הם מבוטחים, או עקב טענות חברות הביטוח שהטיפולים נובעים ממצב בריאותי שקדם לתחילת הביטוח, ונועד למתן את הגידול בהוצאות על בריאות. החוק אושר בבית הנבחרים ב-21 במרץ 2010. נשיא ארצות הברית, ברק אובמה, אישר את החוק למחרת. אובמה הצהיר כי הוא מחשיב את החוק בתור ההישג הפוליטי הגדול ביותר שלו.
הרפורמה במערכת הבריאות תבטיח לראשונה ביטוח בריאות ליותר ל-30 מיליון אמריקאים שעד לאישורו לא היו מבוטחים כלל.

בשבלינו אזרחי מדינת ישראל, אשר כולנו מקבלים ביטוח בריאות כחלק מהותי משירותי המדינה אלינו, המצב של אזרחים בארה"ב (ומה שהרפורמה הזו מנסה לפתור) יכול להיות בלתי נתפס.

המחלוקת – "מפגיני מסיבת התה"

על פניו, נישמע שכולם צריכים לתמוך בזה (וברפורמת הבריאות באופן כללי), אך זה איננו המצב. קבוצה של (לרוב, רפובליקנים) החלו תנועה של הפגנות המכונות "הפגנות מסיבת התה" (עוד על כך כאן), אשר מפגינים בכלל על כל צורה של העלאת מס, ובפרט העלאת המס שתידרש (שאני לא בטוח עד כמה היא בכלל תהיה) בעקבות העברת רפורמת הבריאות שאובאמה קידם.

כדי להמחיש את הדרמטיות של התנגדות המפגינים, הנה סרטון (של פחות מדקה) המראה כיצד מפגינים צועקים על חולה פרקינסון שהתיישב והפגין (בעד רפורמת הבריאות) כנגד המפגינים (כנגד רפורמת הבריאות)

אגב, חולה הפרקינסון הזה הוא בן 60, אובחן בפרקינסון לפני 15 שנה, ולפני כן הוא עבד כמהנדס גרעיני. הוא מחזיק שני תארים שניים ודוקטורט מאוניברסיטת קורנל. הסיבה שהוא עוד לא מת היא כי הוא שילם (בעזרת ביטוח בריאות חלקי) 150,000$ עבור ניתוח שנועד להעריך את איכות חייו. ניתוח שבארץ, כנראה, שהוא היה מקבל גישה אליו בהשתתפות סימלית בהרבה. זה למה הוא מפגין בעד רפורמת הבריאות שאובאמה והדמוקרטים מקדמים. (הנה סרטון שבו בוב, חולה הפרקינסון, מדבר)

אז למה הם מתנגדים?

אחת השאלות שדמוקרטים (כמו, לדוגמא, אישתי הנהדרת) שואלים היא מדוע בכלל האנשים הללו מתנגדים לרפורמת הבריאות. הרי המצב כיום בארה"ב הוא מפלצתי, לפיו המערכת איננה מסוגלת לחשוב באופן של רפואה מונעת, וכל ניסיון להיעזר בשירותי הבריאות מסתכם במאבק (של אנשים חולים) למול חברות הביטוח, אשר יכול בפעמים רבות להוביל לפשיטת רגל של החולה (זו, מסתבר, אחת הסיבות השכיחות ביותר לפשיטות רגל בארה"ב – טיפול רפואי לאנשים ללא ביטוח בריאות "טוב").

וזה מוביל אותנו לסטטיסטיקה.

תפיסת המיסוי של ארה"ב אצל "מפגיני מסיבות התה"

דוד פרום (מישהו), הגיע לאחת מההפגנות של מסיבות התה, ופנה אל המפגיני בשאלה פשוטה "(לדעתכם) כמה מיסים גובה ממשלת הממשלה הפדרלית בארה"ב מהמשק?". על השאלה השיבו 60 מתוך כמה מאות המפגינים שנכחו במקום. הסטטיסטיקות שקיבלנו מתשובות הנבדקים היו (מקור):

תשובה ממוצעת: 42.06% (זוהי התשובה הממוצעת של אחוז המיסוי שאנשים אלו מאמינים שארה"ב גובה מהמשק)
סטיית תקן: 19.06%
מספר מפגינים שנשאלו: 60

התשובה הנכונה היא (על סמך המקור) 31.5%, שזה פחות ממה שהמפגינים ענו בממוצע. השאלה (הסטטיסטית) היא האם אמונת המפגינים לגבי שיעור המס היא מוטה כלפי מעלה באופן מובהק.

ננסח את השאלה באופן יותר מדויק: בהנחה שהמדגם של 60 איש שנשאלו הוא מדגם מייצג לדעות של אנשים מהסוג שמשתתפים בהפגנות מסוג זה (כלומר שהסוקרים לא פנו לשאול, לדוגמא, רק את האנשים שנראו הכי קיצוניים בהפגנה), האם יש לנו מספיק נתונים כדי לדעת האם הדעות של הפגינים מוטות (באופן מובהק סטטיסטית) להיות מעל למציאות? התשובה לדעתי היא כן.

ננסח את השאלה שוב (הפעם, יותר "סטטיסטית"): האם יש לנו עדות מספקת להניח שהתוחלת של התפלגות התשובות של המפגינים, היא שונה (באופן מובהק סטטיסטית) מהערך האמיתי? (זוהי השערת ה-0. ההשערה הנגדית אומרת, שייתכן והמפגינים כן ענו, בממוצע, את הערך הנכון)

באמצעות משפט הגבול המרכזי (לינק למאמרון ויקיפדיה בנושא) נענה על השאלה. לפיו אנו יודעים שהתוחלת של תשובות המפגינים שואפת להתפלגות הנורמאלית. לפי זה נוכל לחשב מהו הרווח בר-סמך התחתון של תוחלת תשובת המפגינים (או בתרגום: מהו הערך הנמוך ביותר שהיינו יכולים לחשוד שהוא הממוצע/התוחלת האמיתית של תשובות המפגינים). המספר יהיה:

42.06 – 1.96 * 19.06/sqrt(60) = 37.24

כלומר, המספר הכי נמוך (כאשר מדברים על רווח בר סמך דו-צדדי) של 95%) שאפשר לצפות שהוא התוחלת האמיתית של תשובות המפגינים, הוא 37.24%. שזה יותר גבוה מ – 31.5% מס (שהוא הערך האמיתי).

למעשה, ההסתברות שנקבל את התוצאות שקיבלנו מהשאלון, בהינתן שהערך האמיתי של תוחלת תשובות המפגינים היא 31.5% היא ערך P (P value) – של  1.623788e-05

(הפקודה ב- R לחישוב היא:

dnorm(42.06,31.5, 19.06/sqrt(60))

)

שאלה שניה שנשאלה הייתה "כמה מס הכנסה פדרלי אתם מאמינים שמשלמת משפחה ממוצעת (עם הכנסות של 50000$ לשנה) ?"
ביחידות של 1,000 דולר, התשובות היו:
תשובה ממוצעת: 12.71
סטיית תקן: 12.06
מספר מפגינים שנשאלו: 60
התשובה הנכונה היא (על סמך המקור) 7.5, שזה פחות ממה שהמפגינים ענו בממוצע. השאלה (הסטטיסטית) היא האם אמונת המפגינים לגבי שיעור המס (המוטל על משפחה ממוצעת) היא מוטה כלפי מעלה באופן מובהק.

כמו קודם, החישוב מראה שכן. עם ערך P של: 0.00094
קוד ה- R לחישוב היה:
dnorm(7.5,12.71, 12.06/sqrt(60))

(קישורון לכיף – הנה דוגמא לפוסט שיוסי לוי כתב בזמנו, בו הוא גם השתמש במשפט הגבול המרכזי: "סקר לדוגמא")

אז מה המסקנה?

המסקנה שלי מהסקר היא שאנשים שלא רוצים שיעלו את המיסים בארה"ב, יש תפיסה פסימיסטית לגבי מצב המיסוי הנוכחי בארה"ב.

שאלת המליון היא מהי כיוון הסיבתיות במקרה שלנו. האם התפיסה הפסימיסטית הזו היא זו שמובילה את האנשים להפגין (ולתת כזה יחס עויין לנושא), או שבגלל שלאנשים אלו יש סיבות אידיאולוגיות לוחמניות כנגד מיסוי (לא משנה איזה מיסוי), הם נוטים להגזים במה שהם חושבים שהוא מצב המיסוי הקיים בארה"ב.

אילו האפשרות הראשונה הייתה נכונה – אז ייתכן שמתן המידע המעודכן לגבי המצב המדוייק, הייתה עוזרת. אילו האפשרות השניה היא הנכונה (מה שהוא הניחוש שלי), אז הסיפור הוא אידיאולוגי/מוסרי – והדיון בו ראוי להתקיים במישור הזה.

אגב, כששאלתי את אישתי מה היא מנחשת שהוא אחוז המיסוי בארה"ב, היא ניחשה 25%. (לא רלוונטי, כיוון שאינני בטוח שאפשר להשוות את המדינה ממנה אישתי מגיעה למדינה שממנה הגיעו הנסקרים)
זה היה יכול להיות מעניין לחזור על סקר דומה באוכלוסיה רחבה יותר, ולראות כיצד התפיסה משתנה לפי עמדות פוליטיות.

* * * *
עידכונים בפוסט:
1) אנשים בתגובות תיקנו אותי שהשאלה נשאלה על מס פדרלי שנגבה, ולא "מס" באופן כללי.
2) אנשים שאלו כיצד המספר היחיד ה"נכון" של המס חושב, בהינתן זה שזהו מס שמשתנה בין מדינות. התשובה היא שאינני יודע. אני משער שמדובר במס הרלוונטי במדינה שבה נערך הסקר. הקורא החרוץ מוזמן לעקוב אחר הקישורים שסיפקתי כדי למצוא את הידיעה המקורית ולראות אם הכותב מספק תשובה. בפוסט זה הנחתי שהוא יודע על מה הוא מדבר (ייתכן וטעיתי, אבל לכרגע אני מרשה לעצמי אופטימיות)

* * * *

תגובותיכם יתקבלו בברכה 🙂