תרשימי עוגה – מאיפה זה הגיע ומה עושים איתם

פורסם בתאריך 3 דצמבר, 2009
נושאים ויזואליזציה | 10 תגובות

לפני מספר חודשים פנה אלי עורך מאחד העיתונים הכלכליים במדינה (לא נציין את שמם) וביקש ממני לכתוב מאמר על סטטיסטיקה. שאלתי אותו אם הוא רוצה מאמר על תרשימי עוגה והוא אמר "בטח, למה לא". כמעט חצי שנה מאוחר יותר, המאמר לא יצא לאור והחלטתי שהגיע הזמן לשחרר אותו כאן לאוויר העולם. תהנו :-)

כשתרשימים נולדו – שם היו תרשימי העוגה

בשנת 1787 הגיעה חבילה לחצרו של מלך צרפת, לואיז ה- 16. השליח היה משוכנע שהמלך ימצא עניין רב בתוכן החבילה, ואכן כך היה. המתנה הייתה ספר שנכתב בידי סקוטי צעיר בשם וויליאם פלייפייר. והספר נקרא "האטלס הפוליטי כלכלי".

שלא כמו אטלסים אחרים באותה תקופה, הספר לא כלל אף מפה. במקום זאת, הוא הכיל תרשימים שלא נראו כמותם בעבר. גרפים שסיכמו נתוני מסחר (בין אנגליה למדינות שונות) ומגוון נתונים כלכליים. על אף שזו הייתה הפעם הראשונה שבה המלך נתקל בתרשימים כאלו, הרי שהוא הבין אותם מיידית וציין בשביעות רצון שהתרשימים יהיו ברורים לכל אדם, לא משנה מהי שפתו.

לקראת סוף המאה ה-18 פירסם וויליאם פלייפייר, מהנדס וייזם, את הספר אותו שלח למלך ולאחריו הוא פרסם ספר נוסף בשם "ספר-תפילות סטטיסטיות".

בספרים אלו העניק וויליאם לעולם דרכים חדשות להציג סטטיסטיקה באמצעות תרשימים. תובנות שעד כה היו קבורות בטבלאות אשר דרשו שניות ואף דקות של עיון ומחשבה, נחשפו להם פתאום בגרפים אשר הציגו את המגמות שמאחורי הנתונים באופן ברור לעין (תרתי משמע).

בספריו הציג וויליאם לעולם את תרשים-העוגה. ובעשותו כן, פתח את הדלת לאחד הקונפליקטים הנפוצים ביותר בהצגה-סטטיסטית אשר נשארה איתנו עד היום. האם בבואנו להציג נתונים עלינו להשתמש בתרשימי-עוגה או בשיטה אחרת? אין כאן מדובר בדבר פעוט. כשם שתמונה שווה אלף מילים, כך התרשים הסטטיסטי שווה אלפי מספרים. מי שרוצה להעביר מסר מהנתונים שברשותו לקוראיו, חובה עליו להעניק תשומת לב לבחירת התרשים שבו הוא משתמש.

pie_pic1

זיהוי החלק מהשלם לעומת השוואת החלקים

תרשים-העוגה היא אולי אחת משיטות הצגת הנתונים הנפוצות בעסקים ובתקשורת. ואף על פי כן, תרשים-העוגה זוכה לביקורת ואף יש הממליצים להימנע ממנה ככל האפשר. בשל כך אנו צפויים לראות תרשימי עוגה יותר בעיתונות ובעולם העסקים ופחות בפירסומים מדעיים.

הסיבה לכך היא שכאשר משווים פרוסות עוגה שונות האחת לשניה, קשה מאד לזהות באיזה סדר גודל פרוסה אחת גדולה מראותה (ולעיתים גם איזו פרוסה היא הגדולה). ואף קשה מכך היא ההשוואה בין תרשימי-עוגות שונים.

הקושי נעוץ בזה שהשוואת הפרוסות בתרשים-העוגה מתבסס על השוואת זוויות או נפחי הפרוסות לעומת בתרשים כמו תרשים-עמודות שם אנו משווים קטעים באמצעות גובהם.

במחקר שנעשה במעבדות AT&T ממחיש את הנקודה האחרונה. במחקר ביקשו מנבדקים לסדר את הקטעים הבאים לפי גודל עולה, הנה דוגמא (שנוצרה באמצעות התוכנה הסטטיסטית R) :

pie_pic2

המחקר הראה שהמיון של הנבדקים את הפרוסות של העוגות היה לא מדוייק ואיטי, בעוד שמיון בתוך תרשימי העמודות היה זריז ומדוייק.

ישנם שלושה מקרים בהם תרשימי קופסא כן שימושיים (ואף עדיפים על תרשימי עמודות): הראשון הוא כאשר אנו רוצים להשוות פרוסה אחת לכלל העוגה. השני הוא כאשר הפרוסות שלנו מחולקות (באופן גס) למקטעים של 25% ו- 50%. והשלישי הוא שאפשר לעשות איתם בדיחות פק-מן.

pie_pic3

וויזואליזציה סטטיסטית נותנת לעיניים שלנו לגלות לנו תובנות מבלי להידרש למילים או מספרים. אך בפעם הבאה שתתקלו בתרשים-עוגה, בררו עם עצמכם האם הגרף שקיבלתם מאפשר לכם להבין מה קרה בנתונים.

קרדיט: שני התרשימים הראשונים לקוחים מהערך "תרשימי עוגה" בוויקיפדיה האנגלית. את התרשים השלישי אני לא מצליח למצוא מי היה הממציא המקורי שלו.

ביולוגיה בקוד-פתוח (שעת הרצאה על ידי אנדרו הסל)

פורסם בתאריך 13 נובמבר, 2009
נושאים ביואינפורמציה | 5 תגובות

"מחשוב וביולוגיה מאד דומים" אומר אנדרו הסל. אבל אנדרו לא עצר בהפרחת משפט כללי לאוויר, הוא הקים קואופרטיב ביוטכנולוגיה ומטרתו היא ליישם את תרבות ה"קוד הפתוח" בתחום שיתוף הידע הביולוגי שלנו.

סקרנים לעוד, הנה הרצאה בת שעה של האיש המשובח הזה עבור "אוניברסיטת הסינגולריות" :

כיצד כולנו הולכים ללמד את גוגל לקרוא

פורסם בתאריך 16 ספטמבר, 2009
נושאים אינטרנט, העתיד, לימוד-מכונה, סטטיסטיקה | השארת תגובה

גוגל הכריזה על רכישת השירות ר-קפצ'ה.

המשמעות של זה היא שגוגל תאסוף מידע שיאפשר לה ליצור אלגוריתמים סטטיסטיים מתקדמים לזיהוי תווים.

כתבתי על זה עוד בבלוג שלי, אתם מוזמנים להכנס ולקרוא:

"על הרכישה של גוגל את ר-קפצ'ה"

קבוצת דיון לישראלים המשתמשים ב-R

פורסם בתאריך 27 אוגוסט, 2009
נושאים אינטרנט, לסטודנטים, סטטיסטיקה | השארת תגובה

עמיתי למקצוע, יונתן רוזנבלט, הקים באחרונה קבוצת דיון בגוגל עבור ישראלים המשתמשים בתוכנה הסטטיסטית, קוד פתוח, R (הנה הסבר מרחב על What is R). הקישור לקבוצה הוא:

http://groups.google.com/group/israel-r-user-group

להתראות שם :)

להמשיך לחפש »