סיווג נושאים

כיצד ניתן להסיק מהם נושאים, כיצד הם מוקצים לדפדפנים של משתמשים וכיצד משתמשים יכולים לשלוט ברשימת הנושאים שלהם.

סטטוס הטמעה

מה זה נושא?

ב-Topics API, הנושא הוא נושא שמעניין את המשתמש, על סמך הוכחות לאתרים שהם נכנסים אליהם.

הנושאים הם אות שעוזר לפלטפורמות הפרסום הדיגיטלי לבחור מודעות רלוונטיות. בשונה מקובצי Cookie של צד שלישי, המידע הזה משותף בלי לחשוף מידע נוסף על המשתמש עצמו או על פעילות הגלישה של המשתמש.

Topics API מאפשר לצדדים שלישיים, כמו פלטפורמות פרסום דיגיטלי, לצפות בנושאים שמעניינים את המשתמש ואז לגשת אליהם. לדוגמה, ה-API עשוי להציע את הנושא 'Fiber & Textile Arts' למשתמש שמבקר באתר knitting.example.

רשימת הנושאים שנעשה בה שימוש ב-Topics API היא גלויה לכולם, נוצרה על ידי בודקים אנושיים, וניתנת לקריאה על ידי אנשים והמטרה שלהם היא להימנע מקטגוריות רגישות. זוהי הרשימה הנוכחית, והיא תתרחב עם הזמן. הרשימה בנויה כטקסונומיה. הנושאים יכולים להיות ברמה גבוהה או ספציפיים יותר. לדוגמה, Food & Drink היא קטגוריה רחבה עם קטגוריית משנה של Cooking & Recipes. אפשר לחלק את קטגוריות המשנה לקטגוריות משנה נוספות.

טקסונומיה כזו של נושאים צריכה ליצור שילוב בין תועלת לפרטיות. אם הנושאים ספציפיים מדי, ניתן להשתמש בהם כדי לזהות משתמש. אם הן כלליות מדי, הן לא מועילות לבחירת תוכן פרסומי או אחר.

טקסונומיית הנושאים מבוססת על שתי דרישות בסיסיות:

  • תמיכה בפרסום מבוסס-עניין
  • שומרים על בטיחות המשתמשים ומגינים על הפרטיות שלהם

הדבר מרמז על כמה שאלות. לדוגמה:

  • מהי הדרך הטובה ביותר לאפשר ל-API להסיק את תחומי העניין של משתמש על סמך פעילות הגלישה שלו, תוך שמירה על פרטיות המשתמש?
  • איך ניתן לבנות את הטקסונומיה כך שתהיה שימושית יותר?
  • אילו פריטים ספציפיים צריכה הטקסונומיה לכלול?

איך ה-API מסיק נושאים שקשורים לאתר

הנושאים נגזרים ממודל מסווג שממפה את שמות המארחים של אתרים לאפס או יותר נושאים. ניתוח של מידע נוסף (כמו כתובות URL מלאות או תוכן הדף) עשוי לאפשר הצגה של מודעות רלוונטיות יותר, אבל גם עלול לפגוע בפרטיות המשתמשים.

מודל המסווג למיפוי שמות מארחים לנושאים זמין באופן ציבורי. כפי שהסבר מציין, ניתן להציג את הנושאים של אתר באמצעות כלים למפתחים בדפדפן. המודל צפוי להתפתח ולהשתפר עם הזמן, ולהתעדכן מעת לעת. התדירות שבה מודל זה עדיין נמצאת בבדיקה.

רק אתרים הכוללים קוד שקורא ל-Topics API נכללים בהיסטוריית הגלישה שמתאימה לחישובים של תדירות נושאים, וקוראים ל-API מקבלים רק נושאים שהם צפו בהם. במילים אחרות, אתרים אינם כשירים לחישובי תדירות של נושאים מבלי שהאתר או שירות מוטמע שמפעילים את ה-API.

בנוסף, מתקשר יכול לקבל רק נושאים שהקוד שלו 'ראה'. לכן, אם קוד של מתקשר אחר רשם נושא מסוים, למשל /Autos & Vehicles/Motor Vehicles (By Type)/Hatchbacks, לדפדפן של משתמש והקוד שלך לא גרם לרישום הנושא הזה בדפדפן של המשתמש, לא תוכל לגלות על נושא העניין הזה עבור הדפדפן של אותו משתמש בעת הקריאה ל-API מהקוד המוטמע שלך. לתשומת ליבך, מכיוון שה-API כולל עכשיו אבות אב כפי שזוהו, הדוגמה שלמעלה, /Autos & Vehicles/Motor Vehicles (By Type)/Hatchbacks, תגרום גם הם למדידה של Autos & Vehicles ו-Motor Vehicles.

הנושאים שמוחזרים עבור המשתמש מחושבים מחדש עבור מבצע הקריאה החוזרת, בהתאם לאתר ברמה העליונה. לדוגמה, אם adtech.example מבקש את הנושאים של המשתמש בתאריך news-a.example, לאחר מכן ב-news-b.example, ולאחר מכן ב-news-c.example, הנושאים שהוחזרו למשתמש יחושבו מחדש בכל אתר. כלומר, סביר להניח שהמתקשר יקבל נושאים שונים למשתמש באתרים שונים ברמה העליונה, מאחר ששלושת הנושאים (המקסימליים) שמוחזרים עבור משתמש מסוים נבחרים באקראי מתוך חמשת המובילים במהלך שלוש התקופות האחרונות (עם סיכוי של 5% לקבל נושא אקראי). לכן למתקשר קשה יותר לזהות את המשתמש לפי הנושאים, כי סביר להניח שהנושאים האלה יהיו שונים באתרים שונים ברמה העליונה (גם עבור אותו משתמש, אותו מתקשר ותקופה של זמן מערכת).

מודל המסווג

הנושאים נאספים באופן ידני עבור 50,000 דומיינים מובילים, והאוסף הזה משמש לאימון המסווג. הרשימה הזו מופיעה באפליקציה override_list.pb.gz, והיא זמינה במחיר של chrome://topics-internals/ במודל הנוכחי בכרטיסייה מסווג. השיוכים בין דומיינים ברשימה משמשים את ה-API במקום הפלט של המודל עצמו.

chrome://topics-internals עם החלונית המסווגת שנבחרה.
בחלונית 'סיווג' בדף chrome://topics-internals מפורטים גרסת המודל, הנתיב שלו והנושאים המשויכים לכל מארח רשום.

כדי להפעיל את המודל ישירות, יש לעיין במדריך של TensorFlow להפעלת מודל.

כדי לבדוק את הקובץ override_list.pb.gz, צריך לפתוח אותו קודם:

gunzip -c override_list.pb.gz > override_list.pb

משתמשים ב-protoc כדי לבדוק אותו כטקסט:

protoc --decode_raw < override_list.pb > output.txt

טקסונומיה מלאה של נושאים עם מזהים זמינה ב-GitHub.

מתן משוב או קלט על מודל המסווג

יש כמה ערוצים שיכולים לשלוח משוב על Topics API. כדי לקבל משוב על מודל המסווג, מומלץ לשלוח בעיה ב-GitHub או להשיב לבעיה קיימת. לדוגמה:

איך נבחרים חמשת הנושאים המובילים של המשתמש

ה-API מחזיר נושא אחד לכל תקופה של זמן מערכת, עד שלושה נושאים לכל היותר. אם מוחזרים שלושה, זה כולל נושאים עבור התקופה הנוכחית והשניים הקודמים.

  1. בסוף כל תקופה של זמן מערכת הדפדפן יוצר רשימה של דפים שעומדים בקריטריונים הבאים:
    • המשתמש ביקר בדף במהלך התקופה הקודמת.
    • הדף כולל קוד שקורא ל-document.browsingTopics().
    • ה-API הופעל (לדוגמה, לא נחסם על ידי המשתמש או דרך כותרת תגובה).
  2. הדפדפן, במכשיר של המשתמש, משתמש במודל המסווג שסופק על ידי Topics API כדי למפות את שם המארח של כל דף לרשימת נושאים.
  3. הדפדפן צובר את רשימת הנושאים.
  4. הדפדפן יוצר רשימה של חמשת הנושאים המובילים לפי תדירות.

לאחר מכן השיטה document.browsingTopics() מחזירה נושא אקראי מתוך חמשת המובילים בכל תקופה של זמן מערכת, עם סיכוי של 5% שכל אחד מהם ייבחר באקראי מתוך הטקסונומיה המלאה של הנושאים. ב-Chrome, המשתמשים יכולים גם להסיר נושאים ספציפיים או לנקות את היסטוריית הגלישה שלהם כדי לצמצם את מספר הנושאים שה-API מחזיר. בנוסף, המשתמשים יכולים לבטל את הסכמתם ל-API.

בדף chrome://topics-internals אפשר להציג מידע על נושאים שנצפו במהלך התקופה הנוכחית.

איך ה-API מחליט אילו מתקשרים רואים אילו נושאים

קריאות ל-API מקבלים רק נושאים שנצפו לאחרונה, והנושאים של המשתמש מתרעננים בכל תקופה של זמן מערכת. כלומר, ה-API מספק חלון מתגלגל שבו מתקשר נתון יכול לקבל נושאים מסוימים.

הטבלה הבאה מציגה דוגמה (אם כי קטנה באופן לא מציאותי) להיסטוריית גלישה היפותטית של משתמש במהלך תקופה של תקופה של זמן מערכת (epoly) ומוצגים נושאים המשויכים לאתרים שבהם הוא ביקר ואת הקריאות ל-API שקיימות בכל אתר (הישויות שמתקשרות ל-document.browsingTopics() בקוד JavaScript הכלול באתר).

אתר נושאים מתקשרים ל-API באתר
yoga.example כושר גופני adtech1.example adtech2.example
knitting.example אומנות adtech1.example
הליכה-holiday.example כושר, נסיעות ותחבורה adtech2.example
diy-clothing.example יצירה, אופנה וסגנון [ללא]

בסוף התקופה (כרגע שבוע אחד), Topics API יוצר את הנושאים המובילים בדפדפן של השבוע.

  • adtech1.example יכול עכשיו לקבל את הנושאים "כושר" ו "מלאכת יד", כי הוא זיהה אותם ב-יוגה.example וגם ב-Kitting.example.
  • adtech1.example לא כשיר לקבל את הנושא 'נסיעות ותחבורה' עבור המשתמש הזה, כי הוא לא נמצא באתרים שהמשתמש ביקר בהם לאחרונה ומשויכים לנושא הזה.
  • adtech2.example ראה את הנושאים "כושר" ו"נסיעות ותחבורה", אבל לא ראה את הנושא "מלאכת יד".

המשתמש ביקר באתר diy-clothing.example, שהנושא שלו הוא 'אופנה וסגנון', אבל לא בוצעו קריאות ל-Topics API באתר הזה. בשלב זה, המשמעות היא שה-API לא יחזיר את הנושא "אופנה וסגנון" לאף מתקשר.

בשבוע השני, המשתמש מבקר באתר אחר:

אתר נושאים מתקשרים ל-API באתר
sewing.example אומנות adtech2.example

בנוסף, קוד מ-adtech2.example מתווסף ל-diy-clothing.example:

אתר נושאים מתקשרים ל-API באתר
diy-clothing.example יצירה, אופנה וסגנון adtech2.example

בנוסף ל"כושר" ו"נסיעות ותחבורה" החל משבוע 1, פירוש הדבר הוא שהנושא adtech2.example יוכל לקבל עכשיו את הנושאים "Crafts" ו"אופנה וסגנון" – אבל לא עד התקופה הבאה, שבוע 3. הדבר מבטיח שצדדים שלישיים לא יוכלו לקבל מידע נוסף על העבר של המשתמש (במקרה זה, עניין באופנה) מכפי שיכלו לקבל באמצעות קובצי cookie.

לאחר שבועיים נוספים, ייתכן שהקטגוריות "כושר" ו"נסיעות ותחבורה" יוסרו מרשימת הנושאים המתאימים ב-adtech2.example, אם המשתמש לא ייכנס לאתרים עם הנושאים האלה שכוללים קוד מ-adtech2.example.

אמצעי בקרה למשתמשים, שקיפות וביטול הסכמה

המשתמשים צריכים להיות מסוגלים להבין את המטרה של Topics API, לזהות את מה שאומרים עליהם, לדעת מתי ה-API נמצא בשימוש ולקבל אמצעי בקרה להפעלה או להשבתה שלו.

הטקסונומיה של ממשק ה-API מאפשרת למשתמשים ללמוד על הנושאים שעשויים להיצע להם על ידי הדפדפן ולשלוט בהם. המשתמשים יכולים להסיר נושאים שהם לא רוצים ש-Topics API ישתף עם מפרסמים או בעלי תוכן דיגיטלי. יש אמצעי בקרה שנועדו לעדכן את המשתמשים לגבי ה-API ולהראות להם איך להפעיל או להשבית אותו. Chrome מספק מידע והגדרות לגבי Topics API בכתובת chrome://settings/adPrivacy. בנוסף, נושאים אינם זמינים לקוראי API במצב פרטי, ונושאים נמחקים כשהיסטוריית הגלישה מוסרת.

רשימת הנושאים שתוחזר תהיה ריקה אם:

  • המשתמש ביטל את ההסכמה ל-Topics API דרך הגדרות הדפדפן בכתובת chrome://settings/adPrivacy.
  • המשתמש ניקה את הנושאים שלו (דרך הגדרות הדפדפן בכתובת chrome://settings/adPrivacy) או ניקה את קובצי ה-cookie שלו.
  • הדפדפן במצב פרטי.

ההסבר כולל פרטים נוספים על יעדי פרטיות ועל האופן שבו ה-API מנסה לטפל בהם.

ביטול ההסכמה באתר

בנוסף ליכולת של המשתמש לבטל את ההסכמה, תוכלו לבטל את ההסכמה ל-Topics API באתר או בדפים שבו. במדריך למפתחים מוסבר איך עושים זאת.

שימוש ב-Topics API באתרים עם prebid.js

כפי שצוין בגרסה של Prebid 7, הקהילה פיתחה באופן פעיל שילוב עם Topics API באמצעות מודול חדש. המודול הזה מוזג בדצמבר 2022.

מידע נוסף זמין כאן:

השלבים הבאים

עניין ושיתוף משוב