ארכיון תגיות: R

השפעת סדר האירוח במפגשי גומלין בכדורגל על זהות המנצחת

בניגוד לדעה הרווחת, לא ניתן לקבוע שסדר האירוח במפגשי גומלין בליגת האלופות מקנה יתרון למארחת המשחק השני.

בסמסטר ב' של 2014, התלמידים אורי פריילכמן, אריאל בוקאי, יותם חרובי ונעמה לסט, החליטו לבדוק במסגרת פרוייקט המחקר שלהם לקורס מבוא לסטטיסטיקה לסטטיסטיקאים אודות ההשפעה של סדר אירוח על המשחק השני במסגרת ליגת האלופות. הנתונים נאספו באופן יסודי, הניתוח הסטטיסטי נעשה היטב, תחת הסייג שהוא ברמה של קורס מבוא, עם כל ההשלכות מכך – לא מדובר במחקר מדעי שעבר ביקורת עמיתים, אז כל מסקנה שמופיע בפוסט זה יש לקחת בערבון מוגבל ולהפעיל חשיבה ספקנית (אף יותר מהרגיל!).
לצורך ההתאמה למדיום, הרשיתי לעצמי לקצץ חלקים מסויימים מהעבודה (אך לא ביצעתי/שיפרתי את המחקר עצמו. כך שאם יש שאלות – מקומן הוא בתגובות).
אם יש לכם שאלות של סקרנות, הצעות לשיפור, ו
מחמאות לתלמידים (ורצוי שיהיו!) אתם מוזמנים לכתוב אותם בתגובות.
וללא מילים נוספות – אני גאה להציג בפניכם את תוצאות המחקר:

תמצית המחקר

ליגת האלופות של אירופה, טורניר הכדורגל היוקרתי ביותר למועדונים, נערך מדי שנה על ידי אופ"א (UEFA), ארגון הגג של התאחדויות הכדורגל האירופאיות. חלק משלבי התחרות נערכים במתכונת המכונה מפגשי גומלין (knockout ties). לפי מתכונת זו, נפגשות שתי קבוצות לזוג משחקים. המנצחת היא זו אשר הבקיעה יותר שערים בסיכום שני המשחקים. כדי לקיים תחרות הוגנת, מארחת כל קבוצה משחק אחד.

במחקר הבא נציג שתי שאלות מחקר. שאלת המחקר הראשונה תתייחס למדגם כולו ותבדוק האם יש לסדר האירוח השפעה על זהות המנצחת במפגשי גומלין. שאלת המחקר השנייה תעסוק רק באותם מפגשים בהם הסתיים המשחק הראשון מבין השניים בתיקו אפס. כאן נרצה לדעת האם סיכוייה של המארחת השנייה לנצח גבוהים מאלה של המארחת ראשונה.

לצורך המחקר אספנו נתונים אודות כל 394 מפגשי הגומלין שהתקיימו בין השנים 1970 – 2012, בהם נקבע סדר האירוח על ידי הגרלה. גילינו כי 53% מהמפגשים הסתיימו בניצחונה של המארחת השנייה, אך לא היה בממצא זה כדי לקבוע כי אירוח המשחק השני מקנה יתרון. לעומת זאת, מצאנו כי 69% מהמפגשים בהם הייתה תוצאת המשחק הראשון תיקו אפס, הסתיימו בניצחונה של המארחת השנייה.

לסיכום, לא ניתן לקבוע באופן כללי, שסדר האירוח משפיע על זהות המנצחת במפגשי גומלין, עם זאת, ניתן לקבוע כי אם המשחק הראשון מסתיים בתיקו אפס, סיכויי המארחת השנייה לנצח גבוהים מאלה של המארחת הראשונה.

להמשיך לקרוא

רשמים מכנס useR!2014

photo (1)

שבוע שעבר נהניתי להשתתף בכנס useR!2014 אשר התקיים באוניברסיטת UCLA בקליפורניה, ארה"ב. הכנס הוא המפגש השנתי של אנשי קהילת ה- R מרחבי העולם, כשהשנה השתתפו בו כ-700 אנשים מהקהילה. (למי שלא מכיר, R היא שפת תוכנה, בקוד פתוח, לתכנות סטטיסטי). אם לסכם, אומר שמדובר היה בחוויה מדהימה. זו הפעם החמישית שאני משתתף בכנס הזה, ומבין כל הכנסים המקצועיים שהיו בחיי, אין ספק שכנסי ה- useR הם הכי מספקים מבחינתי (ברמה המקצועית, האינטלקטואלית, והרגשית). מעבר לתוכן העיוני, הפתיחות והחברותיות של האנשים בקהילת ה- R, היא בדיוק סוג הדברים להם אפשר לצפות במפגשים של תוכנת קוד פתוח.

אם R קרוב לליבכם, אפילו אם אתם בתחילת דרככם, אני מעודד אתכם לעשות מאמץ ולהגיע למפגש useR!2015 אשר יתקיים שנה הבאה בדנמרק (ובמקרה שתעשו כן, אנא שלחו לי מייל – tal.galili@gmail.com, אשמח לדעת שאתם מגיעים).

בשאר הפוסט אני אציף נקודות שעלו לי סביב הכנס. אני לא ממש אלמד אף אחת מהן, ואני גם לא אסקור את כל מה שהיה. אבל אני מקווה שמשהו מזה תמצאו מעניין. להמשיך לקרוא

טילים על ישראל | פלסטינים שנהרגו בידי צה"ל — בין השנים 2002 ל- 2012 – גרפים, נתונים, ומחשבות

הערת הקדמה לקוראים וותיקים וחדשים: הפוסט הזה הוא מאד בסיסי מבחינת הסטטיסטיקה שבו (לטוב ולרע). עיסוקו הוא יותר במציאת נתונים והסתכלות בסיסית עליהם מאשר ניתוחים מורכבים.

חסרי סבלנות לקרוא את הפוסט? פשוט תסתכלו על הגרף שכאן (מספר הטילים על ישראל מול פלסטינים שנהרגו בידי צה"ל – לאורך זמן):

רוצים להבין למה יצרתי את הגרף הזה, באיזה נתונים השתמשתי (מופיעים בסוף הפוסט), ומה אני חושב עליו? תמשיכו לקרוא הלאה…

עידכון (18.11.2012): יצרתי להנתאכם גירסה דינמית של גרף הנתונים, כנסו לפוסט בשביל לצפות בו:

להמשיך לקרוא

אנשי R (בהווה ובעתיד) – בואו ניפגש

על R ועלי:  אלו מיכם שמכירים אותי אישית יודעים שאני שהאהבות הגדולות שלי בחיים (שאינם בני אדם) זה מידע פתוח, קוד פתוח, אינטרנט וסטטיסטיקה. את כל אלו אני זוכה (בצורה כזו או אחרת) לשלב דרך שפת R. R זו סביבת פיתוח, ושפת תכנות, המיועדת לתכנות סטטיסטי. התוכנה מפותחת ומופצת בקוד פתוח ומאפשרת אינספור שימושים והרחבות.

קהילות R בעולם:  באופן דומה לפרוייקטים אחרים כמו ויקפדיה וורדפרס, הפרוייקט המונומנטלי שהוא R מצליח בזכות אינספור מתכנתים וסטטיסטיקאים אשר משפרים את המערכת עוד ועוד. הקהילה של משתמשי R היא קהילה חובקת עולם עם קבוצות אשר נפגשות בערים גדולות ברחבי העולם. קבוצות מקומיות של משתמשי R מכונות גם RUG (R user group). יש רשימה של קבוצות כאלה כאן, ויש גם בלוג עם הרצאות מוקלטות ממפגשי R ברחבי העולם (כאן).

קהילת R בישראל?  ומה לגבי ישראל? בישראל יש קבוצת דיון של משתמשי R בגוגל גרופס אשר הוקמה על ידי יונתן רוזנבלט (תודה יונתן!). וגם היו שני סדנאות על R במהלך שנת 2012, אשר אורגנו על ידי איגוד הסטטיסטיקאים הישראלים (קישור). אבל זה עדיין לא קהילה.

בואו ניפגש: כדי שנהפך להיות קהילת משתמשי R בישראל, אנחנו צריכים להיפגש ולהכיר. רצוי באופן קבוע יחסית (פעם בחודש עד 4 חודשים?). מה שמוביל אותי למטרת הפוסט. אם אתם מעוניינים להיפגש עם אנשי R, אנא השאירו את פרטיכם בטופס הזה (הטופס ממוקם באתר חדש שהוקם לצורך ריכוז מידע עבור הקהילה שתתהווה). אחרי שהטופס יתחיל להתמלא, אני אוכל לקבל מושג על מי עוד "נמצא שם". ולפי זה אפשר יהיה להתחיל לתכנן מפגשים (בהתאם לרקע של האנשים שירשמו), ולגלגל את הכדור הלאה…

רצינות הבלוגר: רק כדי להבהיר שאני רציני לגבי הפוסט הזה – 1) הייתי בין המארגנים של שני כנסי קוד פתוח (וורדקמפ 2007 וורדקמפ 2008). ביוני הקרוב אני מתכנן לטוס לארה"ב לכנס useR!2012 הבינלאומי, אני מניח שבאחד ממפגשי ה- R הקרובים אני אתן הרצאה על דברים מעניינים שאגלה שם. וגם תודה לשלמה יונה (מאאוטבריין) אשר דחף אותי לקדם את הנושא, ומסייע מאד בצד הלוגיסטי והרוחני.

 

מבוא לבלוגוספירה של קהילת ה- R העולמית

בכנס האחרון של useR 2011, אשר התקיים באוניברסיטת ווריק אשר באנגליה, נתתי הרצאה זריזה של כ-5 דקות על הבלוגוספירה של קהילת ה-R העולמית (למי שלא מכיר, הנה הסבר קצר על מה זה R).

לאחרונה פנה אלי קוריאני חביב בשם צ'ל-הי-לי וביקש ממני להקליט את ההרצאה הזו על מנת שהוא יוכל להקרין אותה בכנס R שמתקיים השנה (2011) בדרום קוריאה. החלטתי לעשות זאת, והעליתי את ההרצאה (באורך של כ-7 דקות, באנגלית) לאינטרנט.

ההרצאה עוברת בזריזות על:

  • ההיקף בהתעניינות של הקהילה העולמית בבלוגרים שכותבים על R
  • על מה כותבים בלוגרי R
  • איך לעודד בלוגר שאתה מעריך לכתוב עוד
  • כיצד להתחיל בלוג R בעצמך
  • טיפים על איך לכתוב בלוג כזה
  • עצה אחת על כיצד לפרסם את הבלוג שלך (פשוט להירשם ל- r-bloggers.com)
  • שתי תחזיות קטנות לגבי העתיד של R והבלוגוספירה
תהנו:

(הפוסט הזה גם פורסם באנגלית בבלוג שלי על R)

בשבוע הבא אני מרצה על ניתוח סטטיסטי באמצעות R – אתם מוזמנים :)

R היא התוכנת (קוד פתוח) האהובה עלי לניתוח סטטיסטי של נתונים. ובשבוע הבא אני אתן הרצאה על ביצוע שלל פעולות סטטיסטיות באמצעות R, במסגרת הפעילות של האיגוד הישראלי לסטטיסטיקאים (ותודה ליונתן רוזנבלט, יוסי לוי ואחרים שאינני יודע על פועלם – על אירגון הסדנה). באפשרותכם להירשם לסדנה דרך כאן.

הסדנה שבשבוע הבא תהיה ברמה בסיסית ומתאימה גם לחסרי ניסיון קודם ב- R (אך כן בעלי ניסיון והבנה בסטטיסטיקה). היות ואנחנו מתקדמים לעידן שבו יש יותר ויותר מידע (ופחות ופחות אנשים שיודעים לנתח אותו), אני מאמין שמלבד סטטיסטיקאים, הסדנה צריכה לעניין כל מי שמעוניין לבצע ניתוח נתונים (שהוא מעבר לאקסל), כגון: מתכנתים, אנשי מדעי המחשב, אנשי בסיסי נתונים, חוקרים, אנשי שיווק ועוד ועוד.

גילוי נאות: אינני מרוויח כספית אם יותר או פחות אנשים ישתתפו בסדנה (אני נותן את הרצאתי בהתנדבות), והמוטיבציה שלי להזמינכם מגיעה מאהבתי למקצוע (ובמקביל לרצון שלי לחשוף את עצמי כסטטיסטיקאי).

עוד פרטים (מועתקים מאתר האיגוד הישראלי לסטטיסטיקה)

הסדנה הבסיסית תתקיים בתאריך 4.3.2010.

הסדנה המתקדמת תתקיים בתאריך 24.3.2010.

שתי הסדנאות יתקיימו בבית יד לבנים ברעננה בשעות 9.00-13.00.

פרטים על דרכי ההגעה למקום הסדנה, תחבורה ציבורית וסדרי חניה, יפורסמו בסמוך למועד קיום הסדנאות.

מספר המקומות בכל סדנה מוגבל, ולכן הרשמה מראש מומלצת מאוד גם למי שמעוניין להרשם רק לאחת הסדנאות. הנחה לנרשמים לשתי הסדנאות תינתן  רק לנרשמים מראש. לא נוכל להבטיח השתתפות לנרשמים ברגע האחרון. תדפיסי ההרצאות יחולקו רק לנרשמים מראש.

דמי ההשתתפות בסדנאות:

סטטוסדמי השתתפות בסדנה בודדתדמי השתתפות בשתי הסדנאות (בהרשמה מראש בלבד)
חברי האיגוד50 ₪90 ₪
סטודנטים40 ₪75 ₪
אחרים65 ₪110 ₪

להרשמה לסדנאות לחצו כאן.

במקביל להרשמה האלקטרונית, נודה לכם אם תקדימו ותשלחו המחאה בסך דמי ההשתתפות לפקודת האיגוד הישראלי לסטטיסטיקה אל:
יוסי לוי
היחידה לביוסטטיסטיקה – טבע
רחוב התרופה 12 נתניה 42504

וזאת כדי להקל על ההתארגנות בבוקר הסדנה. עם זאת, יהיה ניתן לשלם בהמחאה או במזומן את דמי ההשתתפות גם בבוקר הסדנה עצמה.

ניתן לבטל את ההשתתפות בסדנה עד שבוע לפני מועד קיומה. במקרה של ביטול, אנא הודיעו על כך לדואל israelstat@gmail.com .

קבוצת דיון לישראלים המשתמשים ב-R

עמיתי למקצוע, יונתן רוזנבלט, הקים באחרונה קבוצת דיון בגוגל עבור ישראלים המשתמשים בתוכנה הסטטיסטית, קוד פתוח, R (הנה הסבר מרחב על What is R). הקישור לקבוצה הוא:

http://groups.google.com/group/israel-r-user-group

להתראות שם 🙂