טאלנטיקוס – גיל גרינגרוז

Talent_Pool

אם תשאלו כל אוהד או מאמן של קבוצה האם הם רוצים שישחקו אצלם השחקנים הכישרוניים ביותר אז באופן גורף, כמעט כולם יאמרו שכן. זו נראית חכמה קטנה מאוד לחשוב שכמה שיש יותר כישרון בקבוצה כך הביצועים של הקבוצה ישתפרו. בשנים האחרונות אנחנו רואים יותר ויותר מקבץ של שחקני על בקבוצה אחת.

זה התחיל אולי עם קבוצת הכוכבים של ריאל מדריד שכונתה הגלקטיקוס בתחילת שנות ה-2000, כששחקני על כמו דיוויד בקהאם, זינאדין זידאן, רונאלדו ואחרים נרכשו במטרה ליצור קבוצת על. בהעדר הגבלות על השכר זה קורה יותר ויותר בכדורגל, בעיקר בספרד ואנגליה, אבל גם בענפי ספורט אחרים. בנבא חברו לברון ג’יימס, דוויין ווייד וכריס בוש לקבוצה אחת, מיאמי, וזכו בשתי אליפויות. לברון מנסה כעת לעשות דבר דומה בקליבלנד יחד עם קווין לב וקיירי אירווין. נראה שרוב האנשים מסכימים שכמה שיש יותר כישרון בקבוצה ככה יותר טוב, אבל האם זה באמת נכון?

לפחות ממידע אנקדוטי נראה שזה לא תמיד עובד. לפעמים שחקנים רבים נאבקים על אותו תפקיד בקבוצה, יש גם מאבקי אגו מי יהיה המוביל ואז נוצרים סיכסוכים בתוך הקבוצה. מה שיוצא זה שסך כל כישרון השחקנים גדול מהשלם. לעומת זאת בקבוצה כמו הסן אנטוניו ספרס שניצחה את לברון ומיאמי בדרך לזכייה באליפות הנבא האחרונה, היה פחות כישרון אבל הקבוצה שיחקה הרבה יותר טוב. אז מה קורה פה? האם כדאי להשקיע בשחקנים טובים? האם יותר שחקנים טובים זה תמיד יותר טוב לקבוצה? מחקר חדש בדק את העניין.

*

הטענה שאוסף כוכבים עלול לפגוע בתפקוד הקבוצה מתבססת על מחקרים שמראים שכאשר יש יותר מדי אנשים עם סטטוס גבוה בקבוצה מסוימת (לא בהכרח קבוצת ספורט אלא זה יכול להיות בכל ארגון), נוצרים מאבקים פנימיים שפוגמים בתפקוד הקבוצתי. מחקרים מראים שאנשים עם טסטוסטרון גבוה נלחמים זה בזה על השליטה או הדומיננטיות בקבוצה. זה משהו שלא ייחודי לבני אדם ומתרחש במקומות רבים בטבע. גורילות למשל, מתפקדות בארגון היררכי ברור כשבראש הפירמידה עומד זכר אלפא. גם אנחנו ירשנו חלק מהנטיות הללו ולכן הגיוני למצוא שיש מאבקים בין פרטים בקבוצה. כל אחד רוצה להתבלט וזה הרבה פעמים מגיע על חשבון מישהו אחר. השאלה הנשאלת היא, האם עודף כישרון פועל בצורה דומה?

כדי לבחון את הנושא נערכו מספר מחקרים בענפי ספורט שונים. במחקר הראשון סיווגו החוקרים את כל נבחרות הכדורגל בעולם לפי רמת הכישרון שלהן. רמת הכישרון נקבעה לפי אחוז השחקנים שיש להם חוזה בקבוצת עילית, כשקבוצת עילית מוגדרת על סמך כמות ההכנסות של המועדון. החוקרים חישבו כמה שחקנים כאלו שיחקו עבור המדינה שלהם במוקדמות גביע העולם של 2010 ו-2014. המדד קצת בעייתי מכיוון שהוא לא מבדיל בין קבוצות עילית שונות שכולן קובצו תחת מטרייה אחת (לא ברור כמה קבוצות נחשבו לעילית במחקר). בנוסף, שחקן עם חוזה בקבוצה לא בהכרח משחק בה הרבה אבל יש להניח שאם הוזמן לשחק במוקדמות גביע העולם אז הוא שחקן שמקבל דקות משחק. בכל אופן, עם כל הסייגים שעולים זה מדד שעדיין נותן הערכה לא רעה של כישרון בקבוצה. ביצועי הקבוצה נמדדו לפי ממוצע דירוגי פיפ”א בשנתיים שלפני המונדיאל, שזו התקופה שבה שיחקו את המוקדמות.

*

בכל אופן, החוקרים מצאו קשר לינארי (של קו ישר) בין איכות השחקנים בנבחרת והביצועים של אותה נבחרת. התוצאות הללו עקביות עם המחשבה שיותר כישרון מוביל ליותר הצלחה. אבל בניתוח מעמיק יותר התגלתה תופעה מעניינת. מודל יותר מדויק של הנתונים הוא מודל ריבועי בצורה של עקומה. המודל מראה שיותר כישרון מוביל ליותר הצלחה אבל רק עד לנקודה מסוימת. בנקודה מסוימת, כשיש יותר מדי כישרון בקבוצה הביצועים מתחילים לרדת. אפשר לראות את זה בצורה ברורה בגרף הבא:

graph 1

כדי לבחון את הנושא יותר לעומק נערך מחקר המשך על קבוצות NBA. המחקר כלל 10 עונות (2002-2012). החוקרים סיווגו את איכות השחקנים על פי מדד שבודק כמה ניצחונות הוסיף אותו שחקן לקבוצה בעונה, בהשוואה לשחקן מחליף שהיה משחק במקומו (EWA – Estimated Wins Added). שחקנים שהיו בשליש העליון במדד קובצו יחד כדי ליצור את קבוצת השחקנים הכי כישרוניים. 99% מהשחקנים שהשתתפו במשחק האול סטאר היו שייכים לקבוצה הזו. לאחר מכן חישבו החוקרים מהן הקבוצות הכישרוניות ביותר על פי אחוז השחקנים הכי כישרוניים בקבוצה בעונה נתונה. ביצועי הקבוצה נמדדו על פי המאזן שלהן בסוף העונה.

תוצאות המחקר הזה היו דומות מאוד לאלו שבמחקר הקודם. גם כאן היה קשר לינארי בין המשתנים אבל המודל הטוב יותר היה של עקומת U הפוכה. הכישרון עוזר לקבוצה עד גבול מסוים שלאחריו חלה ירידה מסוימת בביצועי הקבוצה, כפי שאפשר לראות בגרף הבא:

graph 2

שני המחקרים על נבחרות לאומיות בכדורגל וקבוצות NBA מראים בבירור שיותר מדי כישרון כנראה פוגע בביצועי הקבוצה. מה שמייחד את הכדורגל והכדורסל הוא שאלו משחקים קבוצתיים שבהם נדרשת רמה גבוהה של תאום בין השחקנים השונים. אם יותר מדי כישרון פוגם בתאום בין שחקנים בגלל סיבות שונות כמו מאבקים של מי יחזיק בכדור, ניתן לצפות שבענפי ספורט קבוצתיים שבהם נדרש פחות תאום בין השחקנים לא תהיה תקרה לכישרון השחקנים ויותר כישרון תמיד ישפר את ביצועי הקבוצה.

כדי לבחון את הנושא נערך מחקר המשך על קבוצות בליגת הבייסבול האמריקאית ה-MLB. בבייסבול יש מעט יחסית משחק קבוצתי וכל שחקן יכול להצטיין בלי קשר לשחקנים אחרים בקבוצה. מכיוון שמדובר במאבק בין פיצ’ר לחובט, אין לשחקנים אחרים במגרש השפעה רבה על הביצועים (לתאום הקבוצתי בהגנה יש השפעה). גם כאן נבדקו 10 עונות של MLB והשתמשו בסטטיסטיקה ידועה שנקראת WAR ופירושה Wins Above Replacement שהוא אותה מדד שהזכרתי קודם לגבי הנבא ושמודד את כמות הניצחונות ששחקן מוסיף לקבוצה (הנבא למעשה חיקו את הבייסבול במדד הזה). גם כאן סיווגו שחקני עילית ככאלו שהשתייכו לשליש העליון במדד וחישבו את אחוז השחקנים הללו בכל קבוצה בעונה. לאחר מכן בדקו את כמות הכישרון בקבוצה כנגד מאזן הקבוצה בסוף העונה.

התוצאות היו בהתאם לניבוי. כמו במחקרים קודמים, גם כאן התגלה קשר לינארי מובהק בין כישרון בקבוצה להצלחת הקבוצה, אבל בניגוד למחקרים הקודמים, הקשר לא התהפך והעקומה המשיכה לעלות כל הזמן כפי שהגרף הבא מראה:

graph 3

לסיכום, נראה שבבייסבול, בניגוד לכדורגל וכדורסל, אין בעייה של יותר מדי כישרון בקבוצה ויותר כישרון מתרגם ליותר הצלחה על המגרש. לא ברור לגמרי למה זה קורה אבל סביר שזה קשור למאבקים פנימיים בין שחקנים בכירים שרוצים תפקיד מרכזי יותר בקבוצה. רק בימים האחרונים אנחנו שומעים שכריס בוש, שהיה שחקן בכיר בטורונטו לפני שעבר למיאמי ונאלץ לקבל תפקיד משני ללברון ודוויין ווייד, מזהיר את קווין לאב שלשחק עם לברון יהיה מאוד מתסכל עבורו כי הוא כבר לא יהיה השחקן הכי חשוב בקבוצה שהכל עובר דרכו.

המחקר הזה מסביר למה הרבה פעמים קבוצות עם המון שחקנים כישרוניים לא מגשימות את הציפיות מהם, ושמאבקי אגו מפרקים קבוצות (הלייקרס של שאקיל אוניל, קובי בריאנט, גארי פייטון וקרל מאלון, הם דוגמא קלאסית לכך). נראה שלא תמיד טובת הקבוצה עומדת בפני השחקנים במשחק קבוצתי והם הרבה פעמים חושבים על הסטטיסטיקות האישיות שלהם או רוצים תפקיד מרכזי יותר ממה שיש (המאבקים בין קובי ושאקיל הם הדוגמא הכי טובה לכך). יש בזה לקח לקבוצות כדורגל או כדורסל שמנסות לגייס כמה שיותר כישרון לקבוצות שלהן בלי לחשוב יותר מדי על ההשלכות של זה.

*

כותבי המאמר מביאים כדוגמא את לואיס ואן חאל, שדילל את הכישרון בנבחרת הולנד אחרי הכישלון ביורו ב-2012 והפחית את מספר השחקנים שמשחקים במועדוני עילית, והתוצאה הייתה שהקבוצה לא הפסידה אף משחק במוקדמות המונדיאל לברזיל (הדברים נכתבו עוד לפני שהולנד הצטיינה במונדיאל עצמו וסיימה שלישית, במה שרבים ראו הצלחה מיטבית עם רמת כישרון נמוכה יחסית). נשאר לראות איך זה יבוא לידי ביטוי במנצ’סטר יונייטד אותה הוא מאמן עכשיו ושקנתה שחקנים רבים מהטופ העולמי בקיץ האחרון.

המסקנות של המחקר הולכות הרבה מעבר לקבוצות ספורט. כל ארגון שיש בו סדר היררכי ברור מתפקד טוב יותר, בדיוק כמו גורילות שיודעות מי זכר האלפא ומי מגיע אחריו בסדר היררכי קבוע ויציב (מה שנקרא pecking order). כשההיררכייה לא ברורה, התיפקוד של הקבוצה נפגע, כמו תרנגולות שמטילות פחות ביצים כשיש מאבקים ביניהן על השליטה בקבוצה. לכן המטרה של כל מנהל או מאמן היא לגבש היררכייה ברורה שבא כל אחד יודע את מקומו, אבל אולי חשוב מכך, לא מתנגד לסדר ההיררכי. הדוגמא אולי הכי בולטת בנושא היא שחקן הנבא טים דאנקן שנחשב לאחד השחקנים הגדולים בהיסטוריה ולמרות זאת הוא נטול אגו לחלוטין, וידע לתת לחברים לקבוצה את המושכות על חשבונות ותוגמל בזכייה באליפות. כשאין מאבקים פנימיים הקבוצה מתפקדת טוב יותר ומבזבזת פחות אנרגיה ויכולה להתרכז במשחק עצמו.

ליגת שוקי ההון - מושגים והגדרות
בואו (לא) נהיה פולנים

34 Comments

גילי פלג 12 באוקטובר 2014

מעניין מאד. כן ירבו פוסטים על מחקרים וספורט.

גיל 12 באוקטובר 2014

תודה, יש הרבה מחקרים מאוד מעניינים שאני משתדל להביא כשיש לי זמן.

איציק 12 באוקטובר 2014

מספר הערות:
1. הגרפים צפוים בהחלט.
2. לכולם אופי פרבולי ולא לינארי, גם האחרון רק הוא לא הגיע לשיא (אולי התופעה היתה מתהפכת ב-90% כאשר הגרף עד 80%).
3. המחקר הזה לדעתי לא מסביר למה הרבה פעמים קבוצות עם המון שחקנים כישרוניים לא מגשימות את הציפיות מהם, כי אם הפוך, ההתנהגות של המון שחקנים כישרוניים עם אגו גדול מסבירים את התנהגות הגרפים.
4. אני מניח שיהיה הבדל ענק בין קבוצות שבהן הכשרון הוא לברון, ויד ובוש, לעומת רוז, וסטברוק ואירוינג. כלומר יצירת גיבוי של כוכב על-ידי כוכב אחר בעייתי הרבה יותר מעמדות שונות. לכן כאשר הגרף מגיע ל-50% בערך המגמה מתחלפת. אני מניח שזו הנקודה בה שחקן אחד דורך על האצבעות של האחר כי מתחילה כפילות בתפקוד בצורה מובהקת (אלה אם הגרף לא מתייחס לכשרון שקיים על הספסל כי אם להרכב הראשון בלבד, ואז המעשה של ואן-חאל פחות מסביר את ההצלחה).

גיל 12 באוקטובר 2014

צפויים בעיניי מי? המחקר הראשון שהם עשו שלא דיווחתי עליו היה לבדוק את התפיסות של אנשים לגבי כמות הכישרון בקבוצה. רוב האנשים חשבו שיותר כישרון מוביל ליותר הצלחה.

לגבי התופעה הייתה מתהפכת אפשר לראות בגרף הראשון שעם 100% כישרון המגמה עדיין הפוכה. בגרף השני יש עד 80% כישרון ויותר מזה יהיה קבוצה שמורכבת כולה מאולסטארים.

לא צריך להסביר את התנהגות הגרפים אלא הם התוצאה של המחקר. המחקר לא מסביר לגמרי למה עודף כישרון פוגם בקבוצה אבל הוא מראה שבענפי ספורט שנדרש שיתוף פעולה בין שחקנים זה קורה בעוד בבייסבול, שם אין שיתוף פעולה כמעט הקבוצה מגיעה להישגים כמו כל הכישרונות ביחד (השלם הוא כמו סכום חלקיו). התאוריות שהוצעו להסביר את זה וציינתי אותם מבוססות על מחקרים בארגונים אחרים כמו גם על הסברים אבולוציוניים שם רואים דברים דומים.

מן הסתם כשיש שחקנים מעולים על אותה עמדה זה פוגם בקבוצה וזה כל הרעיון של מאבקי אגו וסטטוס. בבייסבול זה כמעט לא קורה ואני חושב שגם בכדורגל זה קורה פחות מבכדורסל כי יש יותר גמישות בתפקוד של השחקנים.

איציק 12 באוקטובר 2014

צפוי לכל מיש שמשחק משחק קבוצתי (לא ביסבול) אפילו חובבני.
לגבי הגרפים זו בדיוק הנקודה, זה מתהפך הרבה לפני במשחק קבוצתי כיוון שמתחילים לדרוך אחד על האגו של השני (שוב, במידה והאחוזים כוללים את כל הקבוצה כולל הספסל). שני הגרפים הראשונים תואמים יפה את הציפיות, והשלישי לא ברור מה קורה בקטע של 80%-100% אולי גם שם היה קורה המהפך (אפילו אם זה ביסבול).
ודאי שצריך להסביר את הגרפים אחרת זה לא מדע כי אם ציון עובדות יבשות. גם כך זה מחקר די רעוע וההנחות די עמומות.
אני מסכים למרות שמקרה שרקיל/ברינט מראה שאגו יכול להיות די הרסני כשעמדה אחת מאוד תלויה בשנייה. סאן-אנטוניה, ליקרס ובוסטון של שנות ה-80 הן דוגמאות לכמות מאוד גדולה של כשרון שמתועלות נהדר לטובת הקבוצה. מעניין גם מה ההשפעה של אגו גדול על הספסל כמו ג'קסון או ריילי.

גיל 12 באוקטובר 2014

ברור שצריך להסביר את הגרפים באופן כללי וזה בדיוק מה שהמחקר עושה. הוא מתבסס על תאוריה ובוחן אותה והגרפים מראים מה שמנובא. לכן המחקר מסביר בדיוק למה קבוצות מתנהגות איך שהגרפים מראים ולא הפוך כמו שטענת. הגרפים הם תוצאת המחקר.

אי אפשר לדעת מה יקרה בקצה ה90% ומעלה בבייסבול אבל זה גם לא ממש חשוב מכיוון שזה לא ממש קורה בפועל.

והנבא הוא אכן הדוגמא הכי טובה לניצול או חוסר ניצול כישרון. אפילו מיאמי שזכתה בשתי אליפויות לא הציגה איזה כדורסל ייחודי שיזכר לשנים רבות אלא התבססה ברובה על שחקן על אחד. הספרס יזכרו הרבה יותר ממיאמי במובן הזה.

איציק 12 באוקטובר 2014

נראה לי שגם בהוקי התוצאה אמור להיות דומה לכדורסל (אם היה מתבצע מחקר כזה). מצד שני בפוטבול ונניח כדורעף, להערכתי, זה אמור להיות אמצע הדרך בין כדורסל לבייסבול.

b 12 באוקטובר 2014

אני מבין שהמחקר בדק שני מודלים אפשריים, את המודל הלינארי ומודל ממעלה שנייה. האם במחקר נבדקו גם מודלים נוספים כמו לוגריתמי?

גיל 12 באוקטובר 2014

לא לוגריתמי והוא גם לא יתאים כאן. בדקו כל מיני משתנים מתערבים וגם נעשו חתכים שונים למה נחשב לכישרון על אבל התוצאות לא ממש השתנו.

b 13 באוקטובר 2014

תודה גיל, מאיזו סיבה הוא לא יתאים? בגלל האזור שקרוב ל-0? כי לנושא העיקרי בפוסט זה לא רלוונטי. כמובן, יכולות להיות סיבות נוספות.

גיל 13 באוקטובר 2014

כי פונקציה לוגריתמית רלוונטית כשיש לך קפיצות בנתונים או פערים גדולים בין נקודות. בספורט הנתונים נמצאים על רצף. אם היית רוצה לתאר את המרחק של כדור הארץ ממאדים וגם מגלקסיות אחרות אז לוגריתם יכל לעזור. אני גם חושב שבמדעי החברה צריך להשתמש בפונקציה הזו כמוצא אחרון כי הם מעקרים במידה רבה את המשמעות של הנתונים.

איציק 13 באוקטובר 2014

b,
אם אני מבין נכון אתה לא שואל על סקאלה לוגריתמית כי אם קרוב לוגריתמי (אשר בסקאלה לוגריתמית יראה כקו ישר). הקרוב הלוגריתמי ודאי שלא מתאים לגרפים 1, ו-2, כי זה גרף עולה בלבד (עד אינסוף) ושני הגרפים הראשונים הם קמורים. גם הגרף השלישי, למרות שאינו יורד יכול להיות מתואר לא רע באמצעות פונקציה ריבועית (או אולי גם ליניארית) אז קונסיסטנטיות עדיפה אם היא מתאימה. הפונקציה הלוגריתמית עולה מהר בהתחלה וככול שעולים בציר X העליה בציר Y מתונה יותר וזה לא אופי הגרף.

b 13 באוקטובר 2014

גרף לוגריתמי הוא קעור (כאשר יש לו מקדם חיובי) כמו 3 הגרפים שמוצגים פה, אבל הוא עולה לכל אורכו, להבדיל מגרפים 1 ו-2.
ברגע שבודקים מודל מסוים כופים עליו תנאים מסויימים. לדוגמה במודל הריבועי כופים עליו שיש נקודת קיצון אחת. במודל השלישי אנחנו רואים שהיא לא בטווח הרלוונטי אבל דברים יכלו להיות שונים במודל ממעלה שלישית.
היות ולא ראיתי את הבסיס שממנו נלקח המדגם (את פיזור הנקודות על הגרף) אני לא יכול לקבוע האם באמת אין צורך לבדוק מודל מסוים. השאלות היו בעיקר כדי לוודא עד כמה נבדקו אפשרויות שונות.
אגב, השימוש בפונקציה הלוגריתמית במדעי החברה באה לבדוק את התשואה (במקרה הזה התשואה של עוד אחוז שחקנים כישרוניים להופעות הקבוצה) או בבדיקת הגמישות (בכלכלה).

איציק 13 באוקטובר 2014

b,
אני לא יודע האם פונקציה ריבועית מתאימה לגרף השלישי או לא (או כל פונקציה פולינומיאלית מדרגה גבוהה יותר). בכול אופן גם אם אין נקודת קיצון בתחום מסוים זה לא אומר שפונקציה ריבועית לא מתאימה. יתכן והקיצון אמור להיות מחוץ לתחום העיניין.
פונקציה לוגריתמית לא יכולה להתאים אם הנקודות (שחבל שאינן מצוינות) מתפלגות פחות או יותר סביב הגרף הנתון. בגרף לוגריתמי היתה מצפה לעליה חדה ליד הראשית וחדה פחות ופחות כשמתרחקים ממנו (כמובן שהגרף חייב להיות מוזז ב-1, כי אין לוגריתם של אפס).

b 13 באוקטובר 2014

נכון, הזכרתי קודם באיזה חצי משפט שזה יכול להיות רלוונטי רק לאזור שבו מתרכז הפוסט.

גיל 13 באוקטובר 2014

b אתה צודק שברגע שקובעים שזו פונקציה ריבועית אז קובעים נקודת קיצון אחת. עוד נקודות קיצון בהכרח יתנו מודל מדויק יותר לנתונים אבל אז המודל הזה לא יהיה מנבא טוב ויהיה מותאם מדי לנתונים.

איציק 13 באוקטובר 2014

זה ממש לא בטוח. מנבא טוב יכול להיות עם כל מספר של נקודות קיצון השאלה היא האם יש לך מספיק נתונים כדי לאמן מודל כזה. עם יש לך אלפי נתונים ופולינום מסדר 10, אז זו ממש לא בעייה והניבוי יכול להיות יותר טוב מפולינום מסדר 2. אם הנתונים מתנהגים בקרוב טוב כפונקציה ריבועית אז פשוט אין צורך בפונקציה מסובכת יותר.

גיל 13 באוקטובר 2014

כשעוסקים בבני אדם זה די בטוח ומחקרים מראים את זה. לא מדובר בפיסיקה שבה חלקיקים מתנהגים בצורה זהה כל פעם אלא באנשים ובמידע שמטבעו יש בו הרבה רעש. אם משתשמים במעלה עשירית אז המודל ינבא מצוין את הנתונים הקיימים אבל זו תהיה התאמת יתר והוא לא יהיה יעיל על סט חדש של נתונים. לא מכיר מחקר שמשתמש ביותר משתי נקודות פיתול וגם זה לרוב יותר מדי.

איציק 13 באוקטובר 2014

גיל,
מה שאתה אומר לגבי חלקיקים או בני אדם לא קשור. אני עוסק גם בנתותנים עם הרבה "רעש" שמייצרים בני-אדם ומשתמש במודלים הרבה יותר עשירים מאשר פולינום מדרגה עשירית. אין עם זה כל בעייה. העיניין הוא, שיש לי בסט האימון מאות מיליונים של נתוני מידע, ולכן היכולת שלי למודל עשיר אשר יתן ניבוי טוב לנתונים הבאים הוא טוב. השונות (שאתה קורא לה רעש) ממודלת כבר בפנים וזה טוב מאוד.

גיל 13 באוקטובר 2014

למדל אפשר בלי בעייה גם עם 100 פולינומים. השאלה היא אם זה מודל טוב לנתונים חדשים. כשזה קשור לבני אדם אני לא ראיתי מודלים מתוכחמים כאלו שיצרו ניבויים טובים. אולי בפעילויות מוטוריות או קוגנטיביות בסיסיות שבהן השונות גם ככה קטנה, אבל לא בהתנהגויות מורכבות.

איציק 13 באוקטובר 2014

זה ממדל מעולה, זה שלא ראית לא אומר שאין. שוב תסתכל כמה נתונים לי יש לאימון ותבין שאני יכול להכליל את רוב השונות (וזו גם המטרה במקרה שלי), ולכן יש לי ניבוי טוב לנתונים הבאים. כנראה כמויות הנתונים לאימון איתם אתה עובד קטנים ולכן זה לא מאפשר לך לעבוד עם מודלים עשירים. השונות שיש לך אצל בני אדם לא שונה ממה שיש לך בהרבה תחומים אחרים, והגדרה של ניבוי "טוב" גם דרושה, כי טוב זה יחסי, כיוון שאין 100% הצלחה.

גיל 13 באוקטובר 2014

זה שיש הרבה נתונים לא אומר בהכרח שזה מתאים גם לניבוי עתידי. באיזה תחום מדובר?

איציק 13 באוקטובר 2014

זה בהחלט לא אומר, וצריך לבדוק. בהרבה מקרים מודל עשיר יכול להתנון, למשל המקדם של החזקה השלישית יקבל ערך אפס (יותר נכון ישאף לאפס). כלומר מאפשרים לבחור את הפרמטרים האופטימאלים ומתקבל שיורדים למודל נמוך יותר. לפעמים צריך לאלץ מודל פשוט יותר גם אם יש הרבה נתונים לאימון, אך בהרבה מקרים אין בעייה להגדיל את המודל כשיש יותר נתונים.
אני עוסק בטכנולוגיות של זיהוי דוברים.
באפליקציית אימות דובר (שאלה האם זה דובר X, כן או לא) ברור שככול שיש יותר נתונים כדי לבנות מודל עשיר יותר.
לעומת זאת בהפרדת דוברים (נתונה שיחה מרובת דוברים וצריך באופן אוטומאטי לחלק את השיחה למקטעים הומוגניים לפי דוברים כאשר זהות הדוברים אינה ידועה מראש), כאשר מאפשרים מודל עשיר מידי הביצועים מתחילים לרדת.
בשני המקרים יש הסברים מדוע זה כך, ולכן צריך להבין טוב טוב את מהות הבעיה כדי לדעת האם מותר להגדיל את המודל עם הגדלת כמות נתוני האימון או לא.

S&M 13 באוקטובר 2014

מרתק. תודה!

ולכן, מה שחסר בהגדרת "שחקן כשרוני" הוא המדד שלמדנו עליו בשיטת "מאני בול" – התוספת השולית של השחקן. כלומר, מספר הניצחונות איתו ובלעדיו.

כל מדד "מסורתי" של מספר נקודות/אסיסטים/גולים וכו', הוא מדד אנכרוניסטי. אני לא יודע לכמת את זה במדדים רגילים. מישהו צריך לבנות אלגוריתם מוסכם של ניקוד לשחקן, כשיש להוסיף אליו את המשתנה של "תרומה קבוצתית", תוספת של השחקן לקבוצה בדקות שהוא על המגרש.

אני מתכוון לאלגוריתם שהיה מודד את מה שאנחנו קוראים היום "שחקן של מאמן" – רוי קין, פול סקולס, בוסקטס, מקאללה, יוסי אבוקסיס, גאטוסו וכד'.

השחקן הראשון שעולה לי בראש שהיה מרוויח מאלגוריתם כזה הוא נדב הנפלד, למשל. זה היה מקפיץ אותו בכמה דרגות למעלה.

גיל 13 באוקטובר 2014

הבעייה היא שאותה תוספת (שהשתמשו בה במאמר) ניתנת לפרשנויות וחישובים שונים. יש מדדים מסוימים שמקובלים כמו WAR אבל תמיד אפשר לבוא עם נוסחא אחרת.

אייל הצפון 13 באוקטובר 2014

המודל החברתי הבסיסי של ההומו-סאפיינס דומה יותר למודל החברתי של השימפנזה מאשר לזה של הגורילה. תמיד יהיה מאבק על ההנהגה, אבל השלטון יציב יותר שכהמבנה פחות הירארכי (הכי חזר הוא השולט), אלא שיתופי (מי שמשיג את הברית החזקה ביותר הוא השולט). ברור שבמקרה שבו נוצרת ברית שבה כולם מרגישים מורווחים הקבוצה תשיג תוצאות טובות יותר. יש מקרים שבהם שלטון יחיד הוא האופציה הטובה ביותר, אבל זה רק אם שמו של היחיד מתחיל בג'ו ונגמר ברדן. ברוב המקרים שלטון יחיד רק מביא לתסכול גדל והולך וסופו במרד אזרחי. מובן שמדובר רק על קבוצות של עד כמה עשרות פרטים כי עברו פחות מ-10000 שנה מאז שהקבוצה הגדולה ביותר של בני אדם מנתה עשרות בני אדם, והמוח האנושי עוד לא הסתגל לחיים בקבוצות הזדהות של אלפי אנשים, שלא לדבר על מילירד וחצי סינים.

גיל 13 באוקטובר 2014

אנחנו איפה שהוא באמצע כנראה. זה נכון שאין אצלנו מודל היררכי ברור כמו אצל גורילות, אבל מצד שני יש היררכיות מסוימות בהקשרים שונים.

שחר ד. 13 באוקטובר 2014

מאד מעניין, גם הפוסט הזה וגם הפוסטים בבלוג האישי שלך.
כמו כן, אני מצטרף לבקשה שמעלי, מחקרים בנושא ספורט מאד חסרים לנו בשיח בארץ.

גיל 13 באוקטובר 2014

תודה, אני אשתדל להעלות יותר בקרוב.

דיזידין 14 באוקטובר 2014

מעניין מאוד.
ושמחתי לגלות את ההבדל בין כדורגל לבייסבול, זה תואם את התחזית שלי :)
ומה עם פוטבול? אני מנבא שזה דומה יותר לבייסבול.
ובכל מקרה – אין שחקנים גדולים מדי, יש מאמנים (ומנהלים) קטנים מדי.

גיל 14 באוקטובר 2014

פוטבול לא דומה לבייסבול והתוצאות יהיו דומות יותר לכדורגל. זה מאוד תלוי בעמדה גם. קיקרים למשל, לא יושפעו מחברי הקבוצה, וגם ק"ב טובים יצטיינו בלי קשר לאחרים (במידה כמובן). גם רצים. לעומת זאת רסיברים יהיו תלויים מאוד בק"ב שמשחק איתם. מה שכן, בגלל שבפוטבול בהגדרה יש היררכיה ברורה בין השחקנים (ק"ב ושחקני הסקיל שווים יותר מקיקר) אז לא צפויים חיכוכים רבים על זמן משחק או מי מקבל את הכדור. נדיר שחברי הקבוצה רבים אחד עם השני או מתוסכלים שלא נוגעים מספיק בכדור (רסיברים הם היוצא מן הכלל כאן, כולם בכיינים).

דיזידין 14 באוקטובר 2014

תודה, אבל זה לא מובן לי.
מצד אחד הסברת שבפוטבול אין הרבה חיכוכים ותסכולים, אך מצד שני אמרת שהתוצאות יהיו דומות יותר לכדורגל.
אין פה סתירה?

גיל 14 באוקטובר 2014

נכון, אתה צודק. הוא כנראה יהיה בין כדורגל לבייסבול כי מצד אחד יש בו הרבה פחות מאבקי אגו וסטטוס, אבל מצד שני כישרון לבד תלוי בחברי הקבוצה האחרים. יכול להיות שדווקא כאן יתגלה משהו קצת שונה. עד רמה מסוימת של כישרון הישגי הקבוצה יהיו פחות מסך כל מרכיביה, אבל ברגע שיש מספיק כישרון אז ההישגים יהיו גדולים הרבה יותר. שווה באמת לבדוק את זה (החוקרים היו מהולנד אז פוטבול פחות עניין אותם אם כי הם כן כללו את הבייסבול).

איציק 14 באוקטובר 2014

גם אני ניחשתי שזה יהיה בין לבין, וכנראה הוקי יהיה יותר כמו כדורגל, וכך גם כדורמים, רק שזה לא ספורט גדול וכנראה סיכוי נמוך יותר לקבל מלחמות אגו.

Comments closed