ארכיון תגיות: סטטיסטיקה תיאורית

טילים על ישראל | פלסטינים שנהרגו בידי צה"ל — בין השנים 2002 ל- 2012 – גרפים, נתונים, ומחשבות

הערת הקדמה לקוראים וותיקים וחדשים: הפוסט הזה הוא מאד בסיסי מבחינת הסטטיסטיקה שבו (לטוב ולרע). עיסוקו הוא יותר במציאת נתונים והסתכלות בסיסית עליהם מאשר ניתוחים מורכבים.

חסרי סבלנות לקרוא את הפוסט? פשוט תסתכלו על הגרף שכאן (מספר הטילים על ישראל מול פלסטינים שנהרגו בידי צה"ל – לאורך זמן):

רוצים להבין למה יצרתי את הגרף הזה, באיזה נתונים השתמשתי (מופיעים בסוף הפוסט), ומה אני חושב עליו? תמשיכו לקרוא הלאה…

עידכון (18.11.2012): יצרתי להנתאכם גירסה דינמית של גרף הנתונים, כנסו לפוסט בשביל לצפות בו:

להמשיך לקרוא

תרשימי עוגה – מאיפה זה הגיע ומה עושים איתם

לפני מספר חודשים פנה אלי עורך מאחד העיתונים הכלכליים במדינה (לא נציין את שמם) וביקש ממני לכתוב מאמר על סטטיסטיקה. שאלתי אותו אם הוא רוצה מאמר על תרשימי עוגה והוא אמר "בטח, למה לא". כמעט חצי שנה מאוחר יותר, המאמר לא יצא לאור והחלטתי שהגיע הזמן לשחרר אותו כאן לאוויר העולם. תהנו 🙂

כשתרשימים נולדו – שם היו תרשימי העוגה

בשנת 1787 הגיעה חבילה לחצרו של מלך צרפת, לואיז ה- 16. השליח היה משוכנע שהמלך ימצא עניין רב בתוכן החבילה, ואכן כך היה. המתנה הייתה ספר שנכתב בידי סקוטי צעיר בשם וויליאם פלייפייר. והספר נקרא "האטלס הפוליטי כלכלי".

שלא כמו אטלסים אחרים באותה תקופה, הספר לא כלל אף מפה. במקום זאת, הוא הכיל תרשימים שלא נראו כמותם בעבר. גרפים שסיכמו נתוני מסחר (בין אנגליה למדינות שונות) ומגוון נתונים כלכליים. על אף שזו הייתה הפעם הראשונה שבה המלך נתקל בתרשימים כאלו, הרי שהוא הבין אותם מיידית וציין בשביעות רצון שהתרשימים יהיו ברורים לכל אדם, לא משנה מהי שפתו.

לקראת סוף המאה ה-18 פירסם וויליאם פלייפייר, מהנדס וייזם, את הספר אותו שלח למלך ולאחריו הוא פרסם ספר נוסף בשם "ספר-תפילות סטטיסטיות".

בספרים אלו העניק וויליאם לעולם דרכים חדשות להציג סטטיסטיקה באמצעות תרשימים. תובנות שעד כה היו קבורות בטבלאות אשר דרשו שניות ואף דקות של עיון ומחשבה, נחשפו להם פתאום בגרפים אשר הציגו את המגמות שמאחורי הנתונים באופן ברור לעין (תרתי משמע).

בספריו הציג וויליאם לעולם את תרשים-העוגה. ובעשותו כן, פתח את הדלת לאחד הקונפליקטים הנפוצים ביותר בהצגה-סטטיסטית אשר נשארה איתנו עד היום. האם בבואנו להציג נתונים עלינו להשתמש בתרשימי-עוגה או בשיטה אחרת? אין כאן מדובר בדבר פעוט. כשם שתמונה שווה אלף מילים, כך התרשים הסטטיסטי שווה אלפי מספרים. מי שרוצה להעביר מסר מהנתונים שברשותו לקוראיו, חובה עליו להעניק תשומת לב לבחירת התרשים שבו הוא משתמש.

pie_pic1

 

זיהוי החלק מהשלם לעומת השוואת החלקים

תרשים-העוגה היא אולי אחת משיטות הצגת הנתונים הנפוצות בעסקים ובתקשורת. ואף על פי כן, תרשים-העוגה זוכה לביקורת ואף יש הממליצים להימנע ממנה ככל האפשר. בשל כך אנו צפויים לראות תרשימי עוגה יותר בעיתונות ובעולם העסקים ופחות בפירסומים מדעיים.

הסיבה לכך היא שכאשר משווים פרוסות עוגה שונות האחת לשניה, קשה מאד לזהות באיזה סדר גודל פרוסה אחת גדולה מרעותה (ולעיתים גם איזו פרוסה היא הגדולה). ואף קשה מכך היא ההשוואה בין תרשימי-עוגות שונים.

הקושי נעוץ בזה שהשוואת הפרוסות בתרשים-העוגה מתבסס על השוואת זוויות או נפחי הפרוסות לעומת בתרשים כמו תרשים-עמודות שם אנו משווים קטעים באמצעות גובהם.

במחקר שנעשה במעבדות AT&T ממחיש את הנקודה האחרונה. במחקר ביקשו מנבדקים לסדר את הקטעים הבאים לפי גודל עולה, הנה דוגמא (שנוצרה באמצעות התוכנה הסטטיסטית R) :

pie_pic2

המחקר הראה שהמיון של הנבדקים את הפרוסות של העוגות היה לא מדוייק ואיטי, בעוד שמיון בתוך תרשימי העמודות היה זריז ומדוייק.

ישנם שלושה מקרים בהם תרשימי קופסא כן שימושיים (ואף עדיפים על תרשימי עמודות): הראשון הוא כאשר אנו רוצים להשוות פרוסה אחת לכלל העוגה. השני הוא כאשר הפרוסות שלנו מחולקות (באופן גס) למקטעים של 25% ו- 50%. והשלישי הוא שאפשר לעשות איתם בדיחות פק-מן.

pie_pic3

וויזואליזציה סטטיסטית נותנת לעיניים שלנו לגלות לנו תובנות מבלי להידרש למילים או מספרים. אך בפעם הבאה שתתקלו בתרשים-עוגה, בררו עם עצמכם האם הגרף שקיבלתם מאפשר לכם להבין מה קרה בנתונים.

קרדיט: שני התרשימים הראשונים לקוחים מהערך "תרשימי עוגה" בוויקיפדיה האנגלית. את התרשים השלישי אני לא מצליח למצוא מי היה הממציא המקורי שלו.

מאגר נתונים כולל על האינטרנט בישראל – יוזמה חדשה ומרגשת

איגוד האינטרנט הישראלי רוצה להקים ולנהל מאגר נתונים על האינטרנט בישראל. אלו הם חדשות מרגשות, לא רק עבור סטטיסטיקאים אלא לכל מי שהוא "אוהב אינטרנט".

מאגר מידע על "האינטרנט בישראל" (שמיד נפרוט מה דבר כזה יכול להכיל), הוא מה שדרוש לנו כדי לדעת מה מצבנו וכדי לקבל פעולות לאן להמשיך הלאה.

כשמאגר כזה יוקם – יהיה מעניין מאד לדעת כמה אנשים משתמשים באינטרנט, מהי רמת הידע שלהם, מהם קצבי התעבורה, מהם הרגלי הצריכה של אנשים באינטרנט, באיזה מגמות ניתן להבחין ועוד ועוד. מידע כזה יאפשר לממשלה, לגופים עיסקיים ולאנשים בעלי יוזמות למען הקהילה – לדעת טוב יותר איפה להשקיע משאבים וכיצד להתקדם למקום טוב יותר.

כבר קיום הרבה גופים אוספים מידע מסוג זה, אך המידע לא מאורגן במקום מאוחד שיאפשר לנו להגיע אליו ולחקור אותו כדי לגלות תובנות.

לפרטים נוספים, אני מעתיק בזאת את הטקסט שהופץ על ידי איגוד האינטרנט הישראלי:

* * * * * *

איגוד האינטרנט הישראלי: בקרוב – מאגר נתונים כולל על האינטרנט בישראל

איגוד האינטרנט הישראלי מתחיל בתהליך הקמת מאגר נתונים על האינטרנט בישראל. המאגר יכיל נתונים גולמיים שיתעדכנו אחת לתקופה, אודות מגוון מימדים הקשורים לאינטרנט. בין הנתונים הצפויים להופיע במאגר: נושאים טכניים, דוגמת תשתיות פיזיות ותקשורת – רוחבי פס, נפחי תעבורה, שיטות חיבור בבתי אב, עסקים, סקטורים שונים, נתונים הכרוכים בממשל מקוון – שימוש באינטרנט לצורך מתן שירות לאזרח, מעורבות בתהליך קבלת החלטות (Netizenship) והחברה האזרחית – השימוש באינטרנט בחברה האזרחית, התנדבות ברשת, תוכן קהילתי והשימוש באינטרנט בקהילות וירטואליות.

המאגר יכלול גם נתונים בעלי גוון חברתי ועסקי, דוגמת נתוני הפער הדיגיטאלי ואף שימוש באינטרנט בעסקים – היקפי מסחר אלקטרוני ושיווק ופרסום באמצעות האינטרנט. נתונים נוספים שיכיל המאגר הנם כאלו שיתקבלו ממדידות ישירות שמבצע האיגוד, כגון מידע ציבורי על תעבורת ה-IIX, מספרי שמות מתחם תחת ה ccTLD .il , וסקרים אחרים שהאיגוד יבצע במישרין או באמצעות קבלני משנה.

עם השלמתו של המהלך יעמיד האיגוד את המאגר לרשות חוקרי אקדמיה, אנשי עסקים, מקבלי החלטות וכלל הציבור.

כצעד ראשון להקמת המאגר, יצא האיגוד בבקשה לקבלת מידע בנושא, מתוך מטרה לקרוא לבעלי עניין, המחזיקים בנתונים בנושא, מובילי דעת פוטנציאלים בתחום הערכת ומדידת האינטרנט ושותפים נוספים לקחת חלק בפרויקט.

לדברי רימון לוי, נשיא האיגוד, "השימוש הנרחב באינטרנט החל בשני העשורים האחרונים בלבד, ולכן תחום מדידת השימוש באינטרנט עוד בחיתוליו. המאגר יכלול נתונים מסקרים בינלאומיים בהם נכללה גם ישראל וכן סקרים שיבצע האיגוד או השותפים; אנו צופים כי הנתונים האיכותיים ביותר יגיעו מגופים בארץ אשר אוספים אותם כחלק מפעילותם השוטפת".

"השלב הקריטי בהקמת מאגר הנתונים הוא יצירת שותפות בין גופים בעלי נתונים ויכולת מדידה, אומר ד"ר ישע סיון, חבר הנהלת האיגוד ויו"ר הוועדה הטכנולוגית האחראית על קידום הפרויקט. "כגוף ניטראלי, יש ביכולתו של האיגוד להוביל את הקמת מאגר הנתונים תוך יצירת שיתוף פעולה בין השחקנים בתחום באופן שיתרום להם ולציבור הרחב. המאגר יאפשר לקבל החלטות על בסיס מידע מהימן ".

למידע נוסף ולהרחבה:
www.isoc.org.il/sts

איגוד האינטרנט הישראלי
השלוחה הישראלית של איגוד האינטרנט הבינלאומי. האיגוד הינו גוף בלתי תלוי הפועל ללא מטרת רווח למען התפתחות והטמעת את פני האינטרנט בארץ ומייצג את ישראל במסגרות בינלאומיות בעלות חשיבות רבה לקביעת עתיד האינטרנט. האיגוד מעורב בנושאים רבים הקשורים לאינטרנט, דוגמת רישום שמות מתחם בסיומת ישראלית, קידום מערכות פתוחות ופרויקטי קוד פתוח, עידוד ותמיכה בקבוצות משימה בנושאי נגישות לבעלי מוגבלויות, הגנה על ילדים מתכנים פוגעניים ברשת, ואינטרנט לגיל השלישי. כמו כן מפעיל האיגוד את משרד ה-W3C הישראלי. נשיא האיגוד: רימון לוי. אתר אינטרנט: http://www.isoc.org.il

עידכון: בינתיים האתר עלה לאוויר כאן.

סטטיסטיקה טעימה – הסטוגרמה של מרכיבים פופולריים במתכוני מרקים

פרוייקט בוחשים בקלחת, של תופינים ובצק אלים. הגיע לסיומו.
מדובר בפרוייקט כתיבה קבוצתית בבלוגוספירה, שבו כל בלוג מציע את מתכון הבית שלו למרק, ובסוף כולנו נהנים ממתכונים וקישורים.
בפוסט הסיכום לפרוייקט המרקים , מאיה הפליאה לעשות והביאה הסטוגרמה להתפלגות הירקות המשמשים להכנת מרקים. כל כך נהניתי מהגרף, שאני מצרף אותו כאן להנאתכם:
סטטיסטיקת מרכיבים במרקים
רוצים מתכונים – רוצו לפוסט הסיכום של פרוייקט המרקים.