Aperire – מערכת לבניית חבילת מדיניות באמצעות לוגיקה של חוכמת ההמונים

הקדמה

המסמך הבא מתאר את תוכנת Aperire שבניתי בעקבות קורס יישומי לבנית חבילת מדיניות לתחבורה בת קיימא. התוכנה מיישמת את מודל Optic שפותח על ידי תשעה גופי מחקר תחבורתיים שונים על מנת להפיק חבילת מדיניות אופטימלית לתחבורה.

מודל Optic מבוסס על שישה שלבים והתוכנה מתמודדת רק עם השלב השני והשלישי מהרשימה הבאה:

  1. הגדרת מטרות ויעדים.
  2. יצירת בנק כלי מדיניות, הערכה שלהם בהתאם למטרות והיעדים ומיפוי הקשרים בינהם.
  3. הגדרת חבילת מדיניות
  4. ביקורת והתאמה של חבילת המדיניות
  5. הטמעת חבילת המדיניות
  6. מעקב אחרי היישום והערכת חבילת המדיניות

התוכנה לא נועדה להחליף את השיפוט האנושי ולמכן את התהליך לחלוטין, אלא לאפשר ביזור יעיל יותר של המשימות השונות לקבוצה של אנשים על מנת לבצע את העבודה הכמותית בצורה טובה ומאוזנת יותר. על מנת לעשות זאת, השתמשתי בכלים וטכניקות בשם “חוכמת ההמונים” או Crowed-sourcing שהפכו לזמינים בשנים האחרונות.

חבילת מדיניות

כלי מדיניות הם אבני היסוד של חבילות מדיניות: עציוני (1975) מיין אותם לסנקציות, תמריצים ומידע. גיבוש חבילת כלי מדיניות מקובלת פוליטית ואפקטיבית הינה הכרחית להשגת מטרות ויעדים (Banister et al., 2000) תהליך הגיבוש של חבילה כזו מורכב מאוד מכיוון שישנם קשרים שונים בין כלי המדיניות השונים שעלולים ועשויים להשפיע על סך חלקי החבילה בצורה שונה. כמו כן, כל כלי מדיניות משפיע באופן שונה ותורם באופן משתנה להשגת יעדי ומטרות חבילת המדיניות. לא רק שהאפקטיביות משתנה, גם רמת הקבילות של הכלים משתנה מהותית מכלי לכלי ולכן תהליך המיפוי מורכב ביותר. מיפוי של הקשרים בין כלי המדיניות נעשה על בסיס ארבעה גרפים על פי הטכניקה שיושמה בקורס ומתוארת במאמר של (Banares-Alcantara, R., et al).

ניתן לסווג את הקשרים בין כלי המדיניות השונים לארבע קטגוריות.

  1. קשר של התנגשות, כאשר כלי אחד פועל באופן כזה שהוא פוגע בכלי אחר. למשל, הרחבת מדרכות וסלילת שבילי אופנים מתחרים על אותו שטח רחוב מצומצם ועלולים לפגוע ביישום אחד של השני.
  2. הקשר ההפוך הוא התנאי המקדים, כאשר כלי אחד הכרחי ליישום של כלי אחר, למשל, קיום של תחבורה ציבורית יעילה ואיכותית היא תנאי מקדים ליישום של איזור ללא מכוניות.
  3. קשר מסייע (facilitation) מגדיר מערכת יחסים שישום של כלי מדיניות אחד תורם ליישומו של כלי מדיניות אחר. לדוגמא, שתילה של עצים רחבים תורמים ליישום של שבילי הליכה.
  4. קשר של סינרגיה בין כלים, אשר יישומם מסייע אחד לשני.
מסך ראשי לבחירת הפרוייקט
תמונה 1: מסך ראשי לבחירת הפרוייקט

תיאור התוכנה

חוכמת ההמונים או בשמה המקובל יותר Crowed sourcing היא טכניקה לביזור אינטילגנציה אנושית, כשמספר גבוה של “עובדי מידע” יכולים לבצע משימות פשוטות יחסית באמצעות רשת האינטרנט. ניתן לראות יישום של הטכניקה הזו באופן מסחרי על ידי חברת Amazon בשירות ה Mechanical Turk. ניתן לקטלג את המשימות לארבע (Daren C. Brabham, 2013): ניהול וגילוי מידע, ביצוע מבוזר של משימות אינטילינציה אנושית, הרחבת חיפוש לפתרון לבעיה ויצור של מוצרים שונים. תוכנת Aperire פועלת על פי הקטגוריה השניה, ביצוע מבוזר של משימות אינטיליגנציה אנושית.

התוכנה מיושמת כשרת באינטרנט, עם כתובת ציבורית שמאפשרת לכל גולש להרשם ולפתוח פרוייקט חדש או להשתתף בפרוייקט מהפרוייקטים ברשימה הקיימת. לאחר שפותחים פרוייקט צריך להזין בנק של כלי מדיניות, לכל כלי מדיניות יש כותרת ותיאור, שיעזור להסביר את הפעולה של הכלי. לאחר גיבוש רשימה של כלי מדיניות ניתן להתרשם מהרשימה ולהתחיל בתהליך הדירוג והארגון שלהם.

תהליך הארגון של כלי המדיניות מורכב משלושה סוגי שאלות המוצגים למשתמש . המענה על השאלה מבוצע באמצעות לחיצה אחת על התשובה הכי מתאימה ומיד מוצגת השאלה הבאה. נדרשו בדיקות רבות על מנת לנסח את השאלות באופן שיהיה מספיק ברור למשתמש ופשוט להבין במהירות מה נדרש ממנו ולסמן את התשובה המתאימה. כמו כן, המשתמש לא נדרש “לשמור” את התשובה כפי שמקובל באפליקציות דומות והתשובה נשמרת מיד עם הבחירה שלה.

שאלות כאמצעי לדירוג מדיניות

הסוג הראשון של השאלות הוא “איזה כלי מדיניות יותר אפקטיבי?” כשניתן לבחור אחד משני כלים שהמערכת מציגה. באמצעות תשובת המשתמש התוכנה יכולה ליצור רשת של קשרים היררכיים בין כל המדיניות ולהחליט איזה מהכלים הוא האפקיטיבי ביותר ואיזה פחות. ניתן לבחור אחד מכלי המדיניות או לבחור תשובה ניטרלית.

הסוג השני של השאלות מאוד דומה אבל לסוג הראשון והוא “איזה כלי מדיניות ישים יותר?” והכוונה היא לברר איזה כלי מקובל פוליטית יותר על מנת למפות את הכלים שעלולים לעורר אנטגוניזם ולהכשיל את מימוש החבילה. למשל, הפעלת תחבורה ציבורית ביום שבת עלולה לזעזע את הסטטוס קוו ולמנע יישום של חבילת מדיניות וכלים פשוטים, יעיל וקבילים רק מכיוון שהיא קשורה לשאר הכלים בצורה של חבילה.

במסגרת הקורס דירגנו את 100 כלי המדיניות על פי פרמטרים שונים של יישימות וקבילות ומתוך פרמטרים אלו, יצרנו מדד אחוד שנתן לנו הבנה לגבי הכלים היישימים והקבילים ביותר. מדד זה אפשר לנו לצמצם את הרשימה באופן משמעותי. בשיטה זו יש בעייתיות רבה מכיוון שצריך לדרג את הכלים באופן כמותי על ידי הערכה סובייקטיבית ויחסית. כלומר, הדירוג מושפע באופן משמעותי ממי שמדרג והרזולוציה של הדירוג. על מנת שהשיטה הזו תצליח יש צורך במשתמש ברמת מומחה, שיודע לדרג את הכלים בצורה מקצועית ומדוייקת.

תמונה 2:שאלת אפקטיביות
תמונה 2:שאלת אפקטיביות

השיטה החדשה שיישמתי במסגרת התוכנה מאפשרת דירוג שונה של כלי מדיניות שמבוסס על ניתוח רשתי של הקשרים בינהם. השאלה שהתוכנה שואלת את המשתמש היא פשוטה מאוד והרזולוציה שלה מאוד גסה ולכן אין צורך במומחה לענות עליה. מאידך, אגרגציה של התשובות, ביחוד כשהתשובות מגיעות ממשתמשים מרובים ושונים, שענו על השאלות באופן כזה שיש גם חפיפה של שאלות יוצר רשת של קשרים בין הכלים. באמצעות יישום של אלגוריתם Page rank שמדרג את הכלים על פי מספר הקשרים שפונים אליהם באמצעות cellular automata. הוא עובר באופן רקורסיבי על הצמתים ברשת ומחשב להם את הדירוג בהתאם לדירוג של שאר הצמתים שמפנים אליהם. התוצאה היא דירוג מדוייק יותר ברזולוציה גבוהה שבזכות החפיפה של התשובות מצליח לתת מדד יותר אובייקטיבי.

תמונה 3:שאלת קשרים
תמונה 3:שאלת קשרים

הסוג השלישי של השאלות הוא “מה האופי קשר בין כלי 1 לכלי 2?” ולה 4 תשובות: מתנגש, תומך, מסייע ואין השפעה. ראשית יש לשים לב לכך שהשאלה מנוסחת באופן כזה שבודק את ההשפעה של כלי אחד על השני ולא ההפך. השאלה ההופכית תוצג גם היא, אבל לאחר מכן. שנית, אין אפשרות לבחור סינגרגיה, מכיוון שזה סוג קשר דו-כיווני. מבחינת התוכנה, סינרגיה מחושבת כסה”כ הקשרים המסייעים בין שני כלי מדיניות ובאה לידי ביטוי במדד שבין 1- ל 1, ש 1 הוא קשר לכיוון אחד, 0 אין קשר ו 1- הוא קשר לכיוון השני.

שיטת הדירוג הזו דומה לשיטה שבה נקטנו במהלך הקורס, אבל יתרונה בכך שהיא מאפשרת ביזור יעיל של משימות הדירוג בין המשתתפים, חפיפה בתשובות של משתמשים שונים לשאלות דומות וחישוב של הממוצע שמייצג את ערך נכון יותר של הקשר.

רצוי לציין שחישוב סוגי הקשרים אינו בוליאני, אלא לינארי, כלומר, לכל קשר ניתן ציון יחסי שמייצג את עוצמתו היחסית על סמך תשובות חופפות ממשתמשים שונים. הדירוג בכיתה לא איפשר את הרזולוציה של המדד הזה.

ניתוח התוצאות

לאחר איסוף כל התוצאות מכל התלמידים בקורס הן נשלחו לעיבוד בתוכנה גרפית שיצרה גרפים נפרדים לפי ניתוח של סוגי הקשרים, למשל, כלים שמתנגשים, כלים שמסייעים אחד לשני, כלי שהם תנאי מקדים וכד’. בפעם הראשונה ששלחנו את הדירוגים שלנו לויזואליזציה קיבלנו תשובה שהדירוגים שלנו מכילים סתירות לוגיות ועלינו לתקן אותם.

התוכנה, לעמות זאת יוצרת גרף בזמן אמת מהתוצאות שנאספו עד לאותו רגע. בנוסף, פיתחתי גרף שמציג סופר פוזיציה ברורה יותר של המידע שנאסף, להבדיל מסדרת הגרפים מהקורס. קשר מסייע בין כלים מסומן בחץ בצבע כחול, תנאי מוקדם מסומן בחץ ירוק והתנגשות בין כלים מסומנת בחץ אדום. כאשר יש קשר דו-כיווני מכל סוג שהוא הוא מסומן בחץ כו-כיווני.

מעבר לקשרים בין הכלים, הגרף מביא לידי ביטוי גם את האפקטיביות והקבילות של הכלים באמצעות הגרפיקה. ככול שהעיגול שמייצג את הצומת של הכלי גדול יותר, כך הוא אפקטיבי יותר. ככול שהצבע שלו צהוב יותר, כך הוא קביל יותר. העובי של החצים היה אמור להשתנות לפי העוצמה של הקשר בין הכלים, אבל בגלל באג זה לא בא לידי ביטוי.

תמונה 4:גרף הקשרים שהתוכנה מחוללת על פי הנתונים
תמונה 4:גרף הקשרים שהתוכנה מחוללת על פי הנתונים

הגרף מביא לידי ביטוי טוב את המהות של חבילת המדיניות והקשרים בין הכלים כך שברור למקבל ההחלטות שהכלים בחבילה עובדים היטב יחדיו וגם ברור אם נוצרו יותר מחבילה אחת ואיזה כלים ניתן אולי להוציא בגלל התנגשויות, אפקטיביות יחסית נמוכה וקבילות ציבורית נמוכה. מצד שני אפשר גם להבין איזה כלים מהותיים יותר ואיזה מסייעים ביותר ליישום כל החבילה או חלקה.

ההרשמה למערכת היא תנאי לשימוש בה וזאת לא בכדי. האפשרות שלנו לאסוף מידע שמשוייך למשתמש מסויים מאפשרת לנו לבצע להציג רשת של הבחירות הספציפיות של המשתמש. זה יכול להיות שימושי כדי להציג למשתמש את הרשת האישית שלו וזה גם יכול להיות שימושי אם רוצים לנטרל תשובות של משתמשים שמנצלים לרעה את המערכת או כדי לזהות תבנית של משתמשים שיוצרים קבוצות פוליטיות שונות. הרשתות הפרטיות והניתוחים שציינתי לא ייושמו בתוכנה בשלב הזה.

ההרשמה גם חשובה לתהליך ה Crowed sourcing, במיוחד לאור העובדה שאין תמריץ כלכלי לביצוע העבודה, על מנת להציג קרדיט כמותי למשתמשים. ליד כל שם של משתמש שהשתתף בדירוג מופיעים שני מספרים, האחד של מספר הכלים שהוא הוסיף והשני מספר השאלות עליהם ענה.

בנוסף קיים גם מדד השלמה של השאלות שהוא פונקציה של מספר הכלים ומספר הקשרים הפוטנציאליים בינהם יחסית מספר הקשרים בפועל. המספר הזה מיוצג באחוזים, כאשר הוא נמוך מ 100% תמונת הקשרים אינה מלאה וכאשר הוא עובר את ה 100% התוכנה מתחילה לקבל מידע כפול שמאפשר להגעה לתוצאה מדוייקת יותר.

חשוב לי לציין שיש לתוכנה פוטנציאל לשיתוף הציבור בתהליך בניית חבילות מדיניות, שהרי ידוע ששיתוף הציבור בימנו לוקה בחסר. ברור שהתוכנה לא מספיק שימושית על מנת לאפשר למשתמשים פשוטים להפעיל אותה, אבל לאחר הגדרת פרוייקט והקמת בנק כלים ראשוני והדרכה קצרה, גם המשתמשים הפשוטים יוכלו להביע את דעתם באמצעותה.

?כיצד מדע הרשתות תורם לניתוח חבילת המדיניות

על מנת לעשות סדר במטריצת הקשרים הדו-מימדית ושהתוכנה תצליח לעבד את המידע לכדי מידע בעל ערך יש להפעיל כלים מתמטיים לניתוח רשתות ולצורך כך צריך להבין את האופי של הרשת שאותה אנו רוצים ליצר.

בפועל יש 5 רשתות שונות:

  1. רשת אפקטיביות – כל צומת היא כלי מדיניות וכל קשר נוצר כשהמשתמש מחליט איזה כלי אפקטיבי יותר. אין משמעות לאורך הקשר או למיקום המרחבי של הצמתים, אבל יש משמעות למספר הקשרים הנכנסים ולעוצמה שלהם, שנקבעת על ידי ציון שמחושב על ידי תשובות מרובות לאותה שאלה. ברשת הזו יכול להיות מצב של קשרים שמתנגשים הפוכים וגם קשרים שיוצרים פרדוקס, נניח שיש שלושה כלי מדיניות, שכל אחד מהם יותר אפקטיבי מהשני – מה המשמעות של זה? הפתרון לחישוב הזה הוא ישום של אלגוריתם Pagerank על הרשת. האלגוריתם, כפי שציינתי מראש, מחשב את סכום הקשרים הנכנסים, כשכל קשר משקלו על פי משקל הכלי שממנו הוא יוצא. להבדיל מחישוב של קישוריות של הכלים, האלגוריתם מתחשב גם בקישוריות של הכלים הקשורים וכך הלאה עד למצב שנוצר דירוג מדוייק של המשקל היחסי של הכלי. האלגוריתם מתעלם קשרים הפוכים שאותם אנחנו יכולים להגדיר כסתירה או התנגשות ופשוט ממצע את ההשפעה שלהם. הדירוג של הכלים בא לידי ביטוי ברשת בגודל העיגול, ככול שיותר גדול כך יותר אפקטיבי.
  2. רשת יישימות (קבילות) – מנותחת באופן זהה לרשת האפקטיביות ובא לידי ביטוי בצבע של העיגול – ככול שהצבע יותר צהוב כך הכלי יותר יישים.
  3. רשת תנאי מוקדמים – היא מורכבת באופן דומה מקשרים בין הכלים ובאמצעות pagerank אפשר לחשב את החשיבות של היחסית של הכלי. מעבר לכך חישוב של Shell Analysis יכול לעזור לנו לזהות מודולציה ברשת, שהיא בעצם מקבצים של כלי מדיניות, שיכולים להיות חבילות נפרדות.
  4. רשת קשרים מסייעים – פועלת ומחושבת כמו רשת התנאים המוקדמים.
  5. רשת התנגשויות – כל קשר ברשת הזו הוא מייצג בעצם בעיה שיש ביישום של שני הכלים ההקשורים. ניתוח של pagerank יסמן עבורנו את הכלים הבעייתים ביותר.
  6. חיבור של חמשת הרשתות לרשת הסופית מעלה תובנות חדשות על חבילת המדיניות ויוצר רשת חדשה של קשרים מרשת 3,4 ו-5. רשתות 1 ו-2, כפי שציינתו באות לידי ביטוי בהבעה הגרפית של הצומת בלבד.

סיכום

תוכנת Aperire מאפשרת איסוף נתונים יעיל וניתוח אוטומטי ומהיר להפקת גרף של כלי מדיניות שיוצרים חבילת מדיניות. היא מאפשרת ביזור של משימות הדירוג בצורה מאוזנת בין משתמשים שונים ובגלל אופן פעולתה היא מאזנת את הנטיה הסובייקטיבית של המדרגים בשיטות שונות. מאפיין זה של התוכנה מאפשר Crowed sourcing של משימת הדירוג ופותח פתח לרעיונות של שיתוף ציבור בתהליך גיבוש חבילת מדיניות.

התוכנה מחשבת את האפקטיביות ואת היעילות של הכלים בצורה שונה ממה שהיה מקובל עד כה. על ידי יצירת קשרים וקטוריים בין הכלים השונים וחישוב החשיבות שלהם על פי אלגוריתם pagerank התוכנה מספקת מדד חשיבות. שיטה זו נמצאה על ידי כמדוייקת יותר מכיוון שהדירוג נע בין 0 לאינסוף ולא בתוך סקאלה קבועה.

בנוסף לכך, התכונה מציגה יישום של אלגוריתם pagerank, על הקשרים בין הכלים השונים ובכך התוכנה מציגה לא רק את הקשרים באופן פשטני, אלא גם את המשמעות שלהם יחסית לשאר הקשרים.

התוכנה מחדשת גם באופן שבו היא מציגה את תוצאה של כל החישובים באמצעות סופרפוזיציה של כל המידע על גבי גרף אחד שמקל על מקבל ההחלטות להבין את המשמעות של הכלים השונים ושל הקשרים בינהם.

חסרונות ההתוכנה הם שהתוכנה לא יודעת לקבל החלטה בעצמה או להציג חבילות מדיניות מומלצות על פי קריטריונים שונים. כמו כן התוכנה לא מתייחסת למטרות וליעדים של חבילת המדיניות ולא בודקת את ההתאמה של הכלים אליהם ושלוקח המון זמן לענות על כל השאלות על מנת למפות את כל הקשרים.

אני חושב שבעתיד ניתן יהיה ליישם shell analysis או חישוב מודולציה של הרשת על מנת להפיק באופן אוטומטי חבילות מדיניות נפרדות, על פי מקדם מודולציה משתנה. חישוב זה יראה לנו אם הכלים עובדים כחבילה אחת בלבד או יכולים גם כחבילות נפרדות.

לדעתי כדאי לברר כיצד ניתן לנחש את מבנה הרשת הצפוי על בסיס מספר קטן יותר של תשובות משתמשים. זאת מכיוון שמספר התשובות הוא n6 כאשר n הוא מספר הכלים. מספר התשובות הגדול עלול לפגוע במוטיבציה לשימוש בכלי ודורש מאמץ משמעותי. ניתן, לצמצם את הקשרים הנדרשים עבור ניתוח האפקטיביות והישימות אם אפשר לבנות רשת שכוללת לפחות את כל כלים ב cluster יחיד. כמו כן, במקרה שיש כלי מדיניות רבים ניתן להחליט שיש למפות קודם את הכלים האפקטיביים הישימים ביותר לפני שמדרגים את הכלים הפחות ישימים ואפקטיביים על מנת לבנות תמונת מצב, זמנית, נכונה ביותר.

אחד הדברים שחסרים בכלי היא האפשרות להעריך את התקציב שדרוש ליישום של כלי מדיניות. אם יוגדר תקציב ליישום חבילת המדיניות יהיה ניתן לבצע הערכה מושכלת יותר של חבילת המדיניות בזכות הקשר בין היישימות הכלכלית והאפקיביות היחסית. הוספת תקציב תעזור למקבלי ההחלטות להשאר בתחומי היכולות ובכך תחסוך זמן רב.

תודות

המסמך הזה כתבתי כעבודת סיכום בקורס ״רשתות מורכבות״ בהנחיית דר׳ אפרת בלומנפלד-ליברטל.

המערכת נוצרה עבור קורס ״בניית חבילת מדיניות לרובע ללא תחבורה״ בהנחיית דר׳ משה גבעוני באוניברסיטת תל אביב. לצערי עבודת הסמינר לא יצאה לפועל.

הפניות

  1. Banares-Alcantara, R., et al. “Which policy first? A network-centric approach for analysis and ranking of policy measures”.
  2. Brabham, Daren C. “Crowdsourcing as a model for problem solving an introduction and cases.” Convergence: the international journal of research into new media technologies 14.1 (2008): 75-90.‏
  3. Dortheimer, J. Aperire open policy optimization. http://aperire.dortheimer.com/projects/ and https://github.com/dortheimer/aperire
  4. Fearnley, Nils, et al. Best practices and recommendations on policy packaging. 2011.‏
  5. Givoni, Moshe, et al. “From Policy Measures to Policy Packages.” Transport Reviews 33.1 (2013): 1-20.‏
  6. Howe, Jeff. “The rise of crowdsourcing.” Wired magazine 14.6 (2006): 1-4.‏
  7. ‏‏Justen, Nils, et Al. “A process for designing policy packaging: ideas and realities”
  8. Nguyen, Tan B., et al. “Distributed human intelligence for colonic polyp classification in computer-aided detection for CT colonography.” Radiology262.3 (2012): 824-833.‏
  9. Optic, 2010a. Deliverable 1. Inventory of measures, typology of non-intentional effects and a framework for policy packaging. Downloadable from http://optic.toi.no.
  10. Optic, 2010b. Deliverable 2. Inventory of tools and methods for early detection of adverse effects. Downloadable from http://optic.toi.no.
  11. Optic, 2011a. Deliverable 4. Best Practice in Policy Package Design. Downloadable from http://optic.toi.no.
  12. Optic, 2011b. Deliverable 5. How to manage barriers to formation and implementation of policy packages in transport. Downloadable from http://optic.toi.no.
  13. Page, Lawrence, et al. “The PageRank citation ranking: bringing order to the web.” (1999).‏
  14. Seltzer, Ethan, and Dillon Mahmoudi. “Citizen Participation, Open Innovation, and Crowdsourcing Challenges and Opportunities for Planning.” Journal of Planning Literature 28.1 (2013): 3-18.
  15. Vedung E., Policy instruments: typologies and theories, in: Bemelmans-Videc M-L, Rist R.C. and Vedung E. (eds), Carrots, Sticks and Sermons: Policy Instruments and their Evaluation, Transaction Publishers, New Brunswick & London.

Leave a Comment

Your email address will not be published.