ארכיון הקטגוריה: ויזואליזציה

אינפוגרפיקה מטעה: בנק ישראל הוריד את הריבית (ל-0.5%) – אבל לא כמו שזה נראה

היום פורסם ב- ynet ש:

אחרי הפוגה של חמישה חודשים, החליטה היום (ב') הוועדה המוניטרית של בנק ישראל לחדש את הפחתות הריבית והודיעה על הורדת הריבית לחודש אוגוסט ב-0.25%, לנקודת שפל של 0.5%. זאת לאחר שהפחתת הריבית האחרונה שביצע בנק ישראל הייתה כאמור בסוף חודש פברואר.

בכתבה הופיע התרשים הבא:

ribit-2014_aug_big

אך כאשר מתבוננים בריבית של חודש אוגוסט, מתקבל הרושם שהירידה הייתה דרמטית מאד, יותר (למעשה, פי 2) מאשר במעבר מפברואר למרס (למרות שבשני המקרים הירידה הייתה באותה מידה של 0.25%). בדיקה דקדקנית יותר עם עורך גרפי מדגים שזה אכן המקרה:

ha-ribit

שתי הערות נוספות:

  • נקודת ההתחלה של העמודות השונות איננו מציר ה- 0 (מה שקצת מקצין את מידת הירידה), וגם
  • שמתם לב שמיקום תרשימי העמודות אינו ממוקם באופן סימטרי באמצע הפס הציבעוני על פני החודשים השונים? משום מה דצמבר, ינואר ופברואר מיושרים לימין

לטובת ynet, ושאר הקוראים, הנה אותם הנתונים (הגרף יוצר באקסל), אבל כאשר גבהי העמודות נשארות נאמנות לנתונים:

ha-ribit2

אתם מוזמנים להוריד את האקסל מכאן (ולהשתמש בו, או במשהו דומה, בכתבות ההמשך שלכם – אנא עשו זאת).

 

זו דוגמא (מצערת) לחוסר תאימות בין הנתונים המספריים להצגה הגרפית שלהם, זה מיותר (בעיני) לפגום כך ביכולת של הקורא לקבל מושג כמותי וויזואלי לגבי המציאות (ועוד כשכל כך קל לייצר תרשים תקין) – ואני מקווה שאתר חדשות מרכזי כמו ווינט יעשה מאמץ לשפר את התרשימים שלהם בעתיד.

עידכון: ווינט תיקנו את הטעות בתרשים שמופיע אצלם בכתבה 🙂 (למרות ששתי ההערות שציינתי עדיין לא תוקנו)

טילים על ישראל | פלסטינים שנהרגו בידי צה"ל — בין השנים 2002 ל- 2012 – גרפים, נתונים, ומחשבות

הערת הקדמה לקוראים וותיקים וחדשים: הפוסט הזה הוא מאד בסיסי מבחינת הסטטיסטיקה שבו (לטוב ולרע). עיסוקו הוא יותר במציאת נתונים והסתכלות בסיסית עליהם מאשר ניתוחים מורכבים.

חסרי סבלנות לקרוא את הפוסט? פשוט תסתכלו על הגרף שכאן (מספר הטילים על ישראל מול פלסטינים שנהרגו בידי צה"ל – לאורך זמן):

רוצים להבין למה יצרתי את הגרף הזה, באיזה נתונים השתמשתי (מופיעים בסוף הפוסט), ומה אני חושב עליו? תמשיכו לקרוא הלאה…

עידכון (18.11.2012): יצרתי להנתאכם גירסה דינמית של גרף הנתונים, כנסו לפוסט בשביל לצפות בו:

להמשיך לקרוא

כך זינק המס שאנחנו משלמים על הדלק?!

באולפן שישי מהימים האחרונים (30.03.2012), התנוססה לה כתבה תחת הכותרת "כך זינק המס שאנחנו משלמים על הדלק". בכתבה מופיע תרשים מרשים המראה את הטיפוס הבלתי נלאה של המס שאנחנו משלמים על הדלק בעשור האחרון. היות והרבה חברים בפייסבוק החליטו להפיץ את התרשים הזה, החלטתי להסתכל עליו קצת יותר, הנה הוא:

בתרשים הזה יש שני כשלים משמעותיים: הראשון הוא מבחינה עיצובית (תרשים עמודות תלת מימדי, במקום דו מימדי) והשני הוא מבחינת סוג הנתונים שהוצגו (נתונים גולמיים ללא תיקנון). וכעת הסבר מורחב:

להמשיך לקרוא

תרשים של מחירי דירות בשנתיים האחרונות – אני לא רואה בשורות גדולות – ואתם?

מדור הכלכלה של ווינט פירסם לפני כמה שעות את הנתונים שפרסם היום משרד הבינוי והשיכון.

המממ, כשאני אומר "פירסם", כוונתי היא שהעיתון נתן צילום מסך של טבלת נתונים, ביחד עם תיאור של היחס בין מחירי הדירות בתאריכים שונים (דהיינו, הירידה באחוזים).
אז מה הפריע לי? שלהסתכל על (צילום מסך) של טבלת נתונים גדולה לא ממש עוזר לי להבין מה קורה בשוק הדיור (ותיאור האחוזים של הכתבה גם כן לא עוזר).

הכנת הנתונים

רציתי ליצור תרשים של הנתונים. בשלב הראשון, הורדתי את התמונה של טבלת הנתונים מהאתר של ווינט (קישור) . בשלב השני נגשתי לגוגל וחיפשתי "OCR jpg to doc", כדי למצוא אתר שיאפשר לי להמיר את התמונה למספרים (כדי שאני לא אצטרך להתאמץ יותר מידי בהקלדה). הנה קישור לאתר שהצליח לא רע להמיר את התמונה למסמך וורד (קישור). את הטבלה שבקובץ וורד העברתי לאקסל, ותיקנתי כל מיני שגיאות (פסיקים, נקודות, ואפסים חסרים).
אתם מוזמנים להוריד את הקובץ שהתקבל ולחשוב על דברים יצירתיים אחרים לעשות איתו (קישור לקובץ הנתונים).

התרשים של מחירי הדירות בשנתיים האחרונות

מה שמצער אותי זה שאני לא מבין את המשמעות המדוייקת של המחיר. אני לא יודע אם זה מחיר ממוצע לדירה בגודל מסויים. באיזה איזורים בארץ, וכן הלאה. המשמעות המדוייקת של הנתון לוטה בערפל, לא מתואר בכתבה של ווינט, ודורש חפירה באתר של משרד השיכוי והבינוי (וזה בהנחה שהם רשמו את ההסבר שם איפשהו).
אבל בואו נניח שהנתון הזה בכל זאת מייצג משהו על מה שקורה בארץ. הנה התרשים:

הקו הכחול הוא של מחירי דירות יד שניה, בעוד שהקו האדום הוא של מחירי דירות חדשות. הקו השחור שהוספתי על גבי הנתונים הוא החלקה על פני 4 תקופות (אפשר לחשוב על זה כעל קו המגמה "הממוצע" של מחירי הדירות).

מחשבות על הנתונים (ומחאת האוהלים)

כמה תופעות מעניינות צצות כשמסתכלים על הגרף:

  1. מחירי הדירות הם נתון "רועש" בין חודש לחודש (שזה די מרשים לראות כשחושבים על זה שמדובר בממוצע של מחירים). אחת המסקנות שמתקבלות מזה היא שלהשוות חודש ספציפי עם חודש ספציפי בשנה שלפני כן, זה לא בהכרח ההשוואה הכי טובה. מדוע? כי ייתכן שבמקרה (או בכוונה שאיננה "נקיית כפיים") נבחר להשוות שני חודשים עבורם היה הפרש גדול. וייתכן וההפרש הזה הוא מיקרי, ויהיה מתון יותר בחודש שלאחר מכן. זה אומר שלשם השוואות בין תקופות, ייתכן ועדיף להסתכל על נתונים שעברו "החלקה" (דהיינו, "מיצוע", מה שמופיע בתרשיימים למעלה בתור הקו השחור).
    זה גם אומר שיכול להיות חודש שבו פתאום יכריזו ש"מחירי הדירות מתרסקים" (בעיקר כאשר מדובר במחירי הדירות החדשות), אבל שחודש לאחר מכן המחירים שלהם יתאזנו חזרה למחירים הקודמים.
  2. נראה שיש יותר תנודתיות במחירי הדירות החדשות לעומת מחירי הדירות יד-שניה (זה רק מהסתכלות בעין, לא בהכרח מדובר בהבדל מובהק סטטיסטית). הסבר אחד על כך נתן אוהד דנוס, יו"ר לשכת שמאי המקרקעין, אשר אמר בעקבות פרסום הנתונים כי "הודעת משרד השיכון תואמת אחת לאחת את תחזיות לשכת השמאים בדבר ירידת מחירים זמנית, בשיעורים מינוריים, כשהקבלנים מוכנים להתפשר מעט יותר משוק דירות היד השנייה, וזאת רק הממונפים שבהם".
  3. מאז תחילת מחאת האוהלים (דהיינו, יולי 2011), נראה שהייתה "ירידה" במחירי הדירות החדשות והיד-שניה (בהשוואה לשיא). אם כי הירידה היא על פני המגמה, יותר משמעותית בדירות החדשות – ובכל מקרה די זעומה ביחס לשונות הכללית של הנתונים. האם הנתונים האלה מלמדים אותנו שמחאת האוהלים השפיע על שוק הדיור והורידה את מחיריו? זו שאלה מצויינת, אינני יודע את התשובה. ייתכן ומחאת האוהלים הגיע באותו הזמן שהתחילה להתהפך מגמת העלייה של מחירי הדיור.

בשורה התחתונה, אני לא רואה בשורה גדולה בנתונים האלה, רק קצת תובנות שלא ברור לי מה אפשר לעשות איתן.

אם יש לכם מחשבות על מה לעשות עם הנתונים, או איך לפרש אותם – אשמח לקרוא עליהם בתגובות, אני אוהב ללמוד דברים חדשים…

מחירי החשמל עולים, אבל לא ככה – ביקורת על גרפיקה מהעיתון

דף הפייסבוק של ידיעות אחרונותפירסם הודעה עם הגרף שמתחת, ומעליו הטקסט הבא:

התעצבנתם מחשבון החשמל המנופח? כשתקבלו את החשבון הבא תתעצבנו עוד יותר. כתבנו עמיר בן-דוד מדווח כי תעריפי החשמל יעלו בשבוע הבא בעוד 8.9%, ובכך ישלימו זינוק של 24% בתוך שנה. תראו כמה שילמתם אז – וכמה אתם עומדים לשלם עכשיו

אין ספק שכעס זה דבר שמושך תשומת לב של קוראים, ועלייה במחירי החשמל בפירוש עונה על הקריטריון הזה. אבל רגע, האם אתם שמים לב לאיזושהי בעיה בגרף שלמעלה? להמשיך לקרוא

אינפוגרפיקה על ישראל היום ומחאת האוהלים

מחאת האוהלים אשר החלה ברוטשילד מצליחה לסחוף עוד ועוד אזרחים, לצלילי הדממה החברתית שפקדה את מדינתנו בעשורים האחרונים.

ובהזדמנות זו, המחאה גם מצליחה לעורר דיון באופן שבו ערוצי התקשורת המרכזיים מסקרים את המחאה. מה שמוביל אותנו, תאמינו או לא, לסטטיסטיקה.
נתקלתי באינפוגרפיקה המקסימה, אשר משווה את שטח ההתייחסות שכל אחד מהעיתונים המרכזיים (ידיעות, מעריב וישראל-היום) הקדישו למחאת האוהלים בשבוע האחרון.
לחצו על התמונה לגירסה מוגדלת:

מחאת האוהלים - סיקור בתקשורת - אינפוגרפיקה
(קרדיט: לגרפיקאי ליאור צור – misquote. כל הכבוד!)

התמונה מראה את העמוד הראשי של כל אחד משלושת העיתונים לאורך השבוע, וצובעת בורוד את ההופעה של התייחסות למאבק האוהלים. לקינוח, ציטוטים נבחרים מעמוד השער מוצגים לצד התמונה בצהוב.
האם ישראל היום מתייחס פחות למחאת האוהלים מאשר עיתונים אחרים, בהחלט. האם זה מעיד על כך שמדובר ב"ביטאון של ביבי"? בשביל הפרשנות הזו צריך איש תקשורת, לא סטטיסטיקאי… 🙂

העונת נוספת: למרות נסיונות של גורמים כאלה ואחרים לצבוע את המחאה כקיטוב בין מחנות הימין והשמאל הפוליטיים (כפי שאלו מתבטאים בדעות על הסכסוך הישראלי פלסטיני), הרי שהיטיבו לכתוב לפני שמה שבאמת מדובר פה זו הכלכלה, וספציפית, האם אנו שואפים למדינה קפיטליסטית או מדינה המקדמת אג'נדה כלכלית שהיא יותר סוציאלית.

20 היסודות לאינטראקציה עם היצגי נתונים – סיכום הרצאה

ביום רביעי האחרון נתתי הרצאה של 50 דקות בסדנת ויזואליזציה מטעם האיגוד הישראלי לסטטיסטיקה על סוגי הפעולות האפשריות ("היסודות") אשר אפשריים כאשר מבצעים אינטראקציה עם היצגים גרפיים של נתונים (או בלעז: Interactive Data Visualization). בפוסט הנוכחי בכוונתי:

  1. להסביר מה זה אינטראקציה עם היצגי נתונים ולתת את המוטיבציה הסטטיסטית עבורה
  2. לפרט ולהסביר את 20 היסודות לאינטראקציה עם היצגי נתונים
  3. לדבר על ההזדמנויות והאתגרים שמציבים בפנינו היכולת לאינטראקציה עם היצגי נתונים

כל הדוגמאות שיוצגו בפוסט זה יושמו באמצעות התוכנה GGobi (תוכנה חופשית/קוד-פתוח). בפוסט הנוכחי אני לא אדון בתוכנות שמיישמות את העקרונות שיתוארו. אני מקווה לעשות זאת באחד הפוסטים העתידיים. לבינתיים, הנה דמו של 5 דקות על השימוש ב- GGobi (אפשר לקרוא את המשך הפוסט גם מבלי לצפות בו) :

brutally short intro to ggobi from Mat Kelcey on Vimeo.

להמשיך לקרוא

תוספי התזונה הכי יעילים (על סמך מחקרים) – טבלה ותרשים

פוסט זה מספק תרשים אשר מלמד איזה תוסף תזונה הוכח (מחקרית) כיעיל (עבור מצב רפואי זה או אחר).
מטרתי היא שתשלחו את התרשים לדודות שלכם כדי שהם ידפיסו ויתלו אותו על המקרר 🙂  (וגם כדי להעלות את המודעות לידע מחקרי מבוסס, על השימוש בתוספי מזון)

*  *  *

בתוך מסמך הגוגל-דוק הזה מופיעה רשימה ארוכה של מחקרים הבודקים את היעילות של תוספי-מזון לתחומי בריאות שונים. כדי לאפשר לנווט בתוך המסמך, כותביו הוסיפו ליד כל תוסף מזון את מידת המהימנות המחקרית המעידה על ייעלות התוסף בהקשר של טיפול באלמנט בריאותי כלשהו.

המסמך הורכב בידי בלוגר אשר עוסק בהצגה גרפית של מידע ואף פירסם תרשים (מהמם) אשר ממחיש את תוצאות מחקרו. היות והתרשים (למרות שהוא יפה וויזואלית), לא מאפשר השוואה נוחה של תוצאות המטה-מחקר שהבלוגר ביצע, החלטתי לנסות את כוחי ולארגן את תוצאות הטבלה כך שכולנו נוכל להסתכל ולמצוא איזה תוסף מזון עוזר למה. והנה התוצאה כאן (ניתן להקליק כדי לראות את התמונה מוגדלת):
טבלת תוספי המזון הכי יעילים (בהתאם למחקרים עדכניים)

בציר ה- Y של התרשים אפשר לראות את האספקט הבריאותי (לדוגמא: מיגרנה) ומולו בציר ה X אפשר לראות את התוסף שנמצא מחקרית שעוזר לו (לדוגמא: מלטונין). גודל (וצבע) העיגולים בתוך הטבלה/תרשים, מציינים את רמת המספר אשר מייצג עבורנו את מידת המהימנות המחקרית של הקשר בין התוסף לבין הייתרון הבריאותי. כך, לדוגמא, אפשר לראות שמלטונין עוזר למיגרנה רק ברמת מהימנות מחקרית 3 שזו המהימנות הכי נמוכה שהסכמתי להכניס לתוך הטבלה. בנתונים המקוריים, יש גם רמות נמוכות יותר – וכך תוכלו לראות איזה מחקרים בוצעו על תוספים שאתם משתמשים בהם שאינם מופיעים בתרשים שיצרתי (לדוגמא, CoQ10, שקיבל ציונים מאד נמוכים).

אחד הדברים הנחמדים הוא שבגלל שהנתונים הללו נמצאים בתוך גוגל דוק, הרי שכל פעם שהחוקר יעדכן את הטבלה, אפשר יהיה להריץ את הקוד מחדש ולקבל תוצאות מעודכנות יותר של המטא-מחקר שהוא ביצע. המסמך כבר עודכן מספר פעמים (אפשר לראות את יומן השינויים כאן). כך לדוגמא, אומגה-3 קיבל שינוי בציון שלו בהתאם לתגובות הקהל שעידכנו את הבלוגר במידע רפואי עדכני יותר.

ציון ה"מהימנות הרפואית" של הנתונים בתרשים, נוצרה לאחר מחקר של מספר חודשים על ידי סקירה של 1500 מחקרים מ- PubMed ומ- Cochrane.org כאשר הסקירה התמקדה בנתונים שהגיעו מניסויים קליניים גדולים, בבני אדם, אשר בוצעו עם הקצאה מקרית של נבדקים, סמיות ושאר הדברים שעושים בניסויים כאלה. המטרה של מי שאספו את הנתונים הללו היה להתבסס על מחקרים שבוצעו בבני אדם, ולא כאלו שבוצעו על בעלי חיים או תרביות תאים (זאת על מנת להתמקד בדברים שהוכחו כאפקטיביים בבני אדם, ולא באופן עקיף)

*  *  *

את התרשים יצרתי באמצעות התוכנה הסטטיסטית (האהובה עלי) R. והסברתי כיצד עשיתי זאת בבלוג האנגלי שלי בפוסט: Nutritional supplements efficacy score – Graphing plots of current studies results

למה סלט יותר יקר מביג-מק ?

התמונה הבאה היא המחשה (כואבת) של המרחק בין ההמלצות הבריאותיות לבין הסיבסוד הממשלתי של מזון (בארה"ב):
פירמידת מזון ופירמידת סיבסוד ממשלתי למזון

אתגר: מישהו יודע איפה מופיעים הנתונים המקבילים למצב בישראל ? (מידת סיבסוד המזון לעומת ההמלצות הבריאותיות)

תרשימי עוגה – מאיפה זה הגיע ומה עושים איתם

לפני מספר חודשים פנה אלי עורך מאחד העיתונים הכלכליים במדינה (לא נציין את שמם) וביקש ממני לכתוב מאמר על סטטיסטיקה. שאלתי אותו אם הוא רוצה מאמר על תרשימי עוגה והוא אמר "בטח, למה לא". כמעט חצי שנה מאוחר יותר, המאמר לא יצא לאור והחלטתי שהגיע הזמן לשחרר אותו כאן לאוויר העולם. תהנו 🙂

כשתרשימים נולדו – שם היו תרשימי העוגה

בשנת 1787 הגיעה חבילה לחצרו של מלך צרפת, לואיז ה- 16. השליח היה משוכנע שהמלך ימצא עניין רב בתוכן החבילה, ואכן כך היה. המתנה הייתה ספר שנכתב בידי סקוטי צעיר בשם וויליאם פלייפייר. והספר נקרא "האטלס הפוליטי כלכלי".

שלא כמו אטלסים אחרים באותה תקופה, הספר לא כלל אף מפה. במקום זאת, הוא הכיל תרשימים שלא נראו כמותם בעבר. גרפים שסיכמו נתוני מסחר (בין אנגליה למדינות שונות) ומגוון נתונים כלכליים. על אף שזו הייתה הפעם הראשונה שבה המלך נתקל בתרשימים כאלו, הרי שהוא הבין אותם מיידית וציין בשביעות רצון שהתרשימים יהיו ברורים לכל אדם, לא משנה מהי שפתו.

לקראת סוף המאה ה-18 פירסם וויליאם פלייפייר, מהנדס וייזם, את הספר אותו שלח למלך ולאחריו הוא פרסם ספר נוסף בשם "ספר-תפילות סטטיסטיות".

בספרים אלו העניק וויליאם לעולם דרכים חדשות להציג סטטיסטיקה באמצעות תרשימים. תובנות שעד כה היו קבורות בטבלאות אשר דרשו שניות ואף דקות של עיון ומחשבה, נחשפו להם פתאום בגרפים אשר הציגו את המגמות שמאחורי הנתונים באופן ברור לעין (תרתי משמע).

בספריו הציג וויליאם לעולם את תרשים-העוגה. ובעשותו כן, פתח את הדלת לאחד הקונפליקטים הנפוצים ביותר בהצגה-סטטיסטית אשר נשארה איתנו עד היום. האם בבואנו להציג נתונים עלינו להשתמש בתרשימי-עוגה או בשיטה אחרת? אין כאן מדובר בדבר פעוט. כשם שתמונה שווה אלף מילים, כך התרשים הסטטיסטי שווה אלפי מספרים. מי שרוצה להעביר מסר מהנתונים שברשותו לקוראיו, חובה עליו להעניק תשומת לב לבחירת התרשים שבו הוא משתמש.

pie_pic1

 

זיהוי החלק מהשלם לעומת השוואת החלקים

תרשים-העוגה היא אולי אחת משיטות הצגת הנתונים הנפוצות בעסקים ובתקשורת. ואף על פי כן, תרשים-העוגה זוכה לביקורת ואף יש הממליצים להימנע ממנה ככל האפשר. בשל כך אנו צפויים לראות תרשימי עוגה יותר בעיתונות ובעולם העסקים ופחות בפירסומים מדעיים.

הסיבה לכך היא שכאשר משווים פרוסות עוגה שונות האחת לשניה, קשה מאד לזהות באיזה סדר גודל פרוסה אחת גדולה מרעותה (ולעיתים גם איזו פרוסה היא הגדולה). ואף קשה מכך היא ההשוואה בין תרשימי-עוגות שונים.

הקושי נעוץ בזה שהשוואת הפרוסות בתרשים-העוגה מתבסס על השוואת זוויות או נפחי הפרוסות לעומת בתרשים כמו תרשים-עמודות שם אנו משווים קטעים באמצעות גובהם.

במחקר שנעשה במעבדות AT&T ממחיש את הנקודה האחרונה. במחקר ביקשו מנבדקים לסדר את הקטעים הבאים לפי גודל עולה, הנה דוגמא (שנוצרה באמצעות התוכנה הסטטיסטית R) :

pie_pic2

המחקר הראה שהמיון של הנבדקים את הפרוסות של העוגות היה לא מדוייק ואיטי, בעוד שמיון בתוך תרשימי העמודות היה זריז ומדוייק.

ישנם שלושה מקרים בהם תרשימי קופסא כן שימושיים (ואף עדיפים על תרשימי עמודות): הראשון הוא כאשר אנו רוצים להשוות פרוסה אחת לכלל העוגה. השני הוא כאשר הפרוסות שלנו מחולקות (באופן גס) למקטעים של 25% ו- 50%. והשלישי הוא שאפשר לעשות איתם בדיחות פק-מן.

pie_pic3

וויזואליזציה סטטיסטית נותנת לעיניים שלנו לגלות לנו תובנות מבלי להידרש למילים או מספרים. אך בפעם הבאה שתתקלו בתרשים-עוגה, בררו עם עצמכם האם הגרף שקיבלתם מאפשר לכם להבין מה קרה בנתונים.

קרדיט: שני התרשימים הראשונים לקוחים מהערך "תרשימי עוגה" בוויקיפדיה האנגלית. את התרשים השלישי אני לא מצליח למצוא מי היה הממציא המקורי שלו.