מילון מונחים
מונחי מפתח מעולם הסקרים והבינה המלאכותית.
ניתוח סנטימנט (Sentiment Analysis)
תהליך שבו בינה מלאכותית מזהה את המטען הרגשי של טקסט — חיובי, שלילי או ניטרלי — כדי להבין את התחושה שמאחורי תשובות פתוחות.
עיבוד שפה טבעית (NLP - Natural Language Processing)
תחום בבינה מלאכותית המאפשר למחשבים להבין, לפרש וליצור שפה אנושית — הבסיס לניתוח אוטומטי של תשובות טקסטואליות בסקרים.
NPS (Net Promoter Score)
מדד נאמנות לקוחות המבוסס על השאלה “מה הסיכוי שתמליץ?”; מחשבים כאחוז המקדמים פחות אחוז המבקרים.
CSAT (Customer Satisfaction Score)
מדד שביעות רצון מאינטראקציה או חוויה ספציפית, לרוב בסולם 1–5; נמדד כאחוז העונים בציונים הגבוהים.
לוגיקת דילוגים (Skip Logic)
כללים המציגים למענה רק שאלות רלוונטיות בהתאם לתשובות קודמות, ליצירת חוויית סקר מותאמת.
לוגיקת הסתעפות (Branching)
מבנה זרימה המפנה משיבים למסלולים שונים בשאלון בהתאם לנתונים או תנאים שהוגדרו מראש.
פייפינג (Piping)
שילוב אוטומטי של תשובה קודמת בתוך טקסט של שאלה/הודעה כדי להרגיש אישי וממוקד.
אקראיות הצגה (Randomization)
ערבול סדר שאלות/אפשרויות כדי לצמצם הטיית סדר (Primacy/Recency) ולשפר מהימנות.
בדיקת A/B
השוואת שתי גרסאות של שאלה/מסר/מסך כדי לזהות איזו אפשרות משיגה ביצועים טובים יותר.
בדיקה מרובת משתנים (Multivariate)
ניסוי שמשנה כמה אלמנטים במקביל כדי להבין את התרומה והאינטראקציות ביניהם.
קונג'וינט (Conjoint Analysis)
שיטה למדידת העדפות תכונות מוצר על ידי בחירות בין קומבינציות; מחשבת תועלת (Utility) לכל תכונה.
MaxDiff
שאלת “הכי/הכי פחות” המדרגת חשיבות של פריטים ביעילות גבוהה ובאבחנה טובה בין פריטים.
TURF Analysis
ניתוח שמזהה שילוב פריטים/הצעות המגיע למקסימום כיסוי (Reach) בקהל יעד.
סולם ליקרט (Likert)
סולם הסכמה מדורג (לרוב 5 או 7 נקודות) למדידת עמדות ותפיסות.
סמנטי דיפרנציאלי (Semantic Differential)
סולם בין זוגות תכונות מנוגדות (למשל “חדשני–מיושן”) למדידת דימוי מותג/מוצר.
שאלה דיכוטומית
שאלה עם שתי אפשרויות בלבד (כן/לא), מתאימה לסינון מהיר.
רב־ברירה חד־תשובה (Single Select)
שאלה שבה בוחרים אפשרות אחת מתוך רשימה; טובה לזיהוי העדפה ראשית.
רב־ברירה רב־תשובה (Multi Select)
שאלה המאפשרת לבחור כמה אפשרויות; משקפת סל העדפות ולא בחירה בודדת.
שאלת מטריצה (Matrix)
הצגת מספר היגדים באותו סולם דירוג בטבלה קומפקטית; דורש תשומת לב לעומס קוגניטיבי.
שאלת סליידר (Slider)
דירוג רציף באמצעות גרירת נקודה על ציר; יוצר מעורבות אך דורש נגישות טובה.
כוונת נטו (Net Intent)
חישוב כוונת פעולה נטו (למשל רכישה) כאחוז המתכוונים פחות אחוז הלא מתכוונים.
Top-2-Box
סיכום אחוז הנבחרים בשתי הקטגוריות הגבוהות בסולם דירוג (למשל “מרוצה מאוד/מרוצה”).
שיעור היענות (Response Rate)
אחוז המשיבים מתוך כלל המוזמנים; מושפע מרלוונטיות, זמן, ותמריצים.
שיעור השלמה (Completion Rate)
אחוז שהחלו את הסקר והשלימו אותו; מדד לחיכוך אורכי/תוכני.
נטישה/נשירה (Breakoff)
עזיבת הסקר לפני סיום; נמדדת יחד עם נקודת הנטישה כדי לשפר חוויית מילוי.
משך ראיון (LOI - Length of Interview)
משך ממוצע למילוי סקר; משפיע על היענות ואיכות נתונים.
שיעור היתכנות (IR - Incidence Rate)
אחוז הקהל המתאים לקריטריוני ההשתתפות מתוך כלל הפניות.
מסגרת דגימה (Sampling Frame)
הרשימה או מקורות הנתונים שמהם נבחרים נבדקים לדגימה.
דגימה מקרית (Probability Sampling)
שיטה שבה לכל יחידה באוכלוסייה הסתברות ידועה להיבחר, מאפשרת הכללה סטטיסטית.
דגימה בשכבות (Stratified)
חלוקת האוכלוסייה לשכבות הומוגניות ודגימה מכל שכבה לפי יחס/מכסות.
דגימת אשכולות (Cluster)
בחירת אשכולות (קבוצות) באופן מקרי ודגימת יחידות מתוך האשכולות הנבחרים.
דגימה שיטתית (Systematic)
בחירה כל k-יחידות מרשימה מסודרת לאחר נקודת התחלה אקראית.
דגימת נוחות (Convenience)
דגימה על בסיס זמינות ולא הסתברות; מהירה אך פחות מייצגת.
דגימת “כדור שלג” (Snowball)
גיוס משתתפים דרך הפניות של משתתפים קיימים, מתאים לאוכלוסיות קשות לאיתור.
פאנל סקרים
קהילת משיבים זמינה למחקרים חוזרים עם פרופילים ידועים ומנגנוני תגמול.
מכסות (Quotas)
הגדרת גבולות גיוס לכל תת־קבוצה (למשל גיל/מין) כדי להבטיח ייצוג הולם.
הטיית משקלול (Weighting)
התאמת תרומת המשיבים בסטטיסטיקה כדי להתאים התפלגות למדגמת יעד.
פוסט־סטרטיפיקציה
שקלול נתונים לאחר האיסוף כך שהתוצאות יתאימו להתפלגויות ידועות באוכלוסייה.
הטיית אי־מענה (Nonresponse Bias)
עיוות תוצאות הנובע מהבדלים שיטתיים בין מי שהשיבו למי שלא.
הטיית מענה (Response Bias)
עיוות שנגרם מאופן ניסוח/סדר/הקשר שאלה שמוביל תשובות מסוימות.
הטיית בחירה (Selection Bias)
פער מייצוגיות בגלל תהליך בחירה לא אקראי של המשיבים.
הטיית רצייה חברתית
נטייה לענות “נכון” חברתית ולאו דווקא בכנות, במיוחד בנושאים רגישים.
הטיית הסכמה (Acquiescence)
נטיית משיבים להסכים עם היגדים ללא קשר לתוכן, מצריכה איזון ניסוח.
סתיפיקציה (Satisficing)
בחירת תשובה “מספיקה” ולא מיטבית עקב עומס, אורך או חוסר מעורבות.
השפעות סדר (Order Effects)
השפעת מיקום שאלה/אפשרות על התשובה בשל עייפות, הקשר או זיכרון.
אפקט קדימות (Primacy)
נטייה לבחור באפשרויות הראשונות המוצגות ברשימה.
אפקט אחרונות (Recency)
נטייה לזכור/להעדיף את האפשרויות האחרונות שהוצגו.
אפקט עוגן (Anchoring)
השפעת מספר/דוגמה מוקדמת על הערכות מאוחרות יותר של המשיב.
בדיקת קשב (Attention Check)
שאלה/הנחיה שמוודאת שהמשיב קורא וממוקד (למשל “סמן 3”).
זיהוי “מהירי־על” (Speeders)
סינון משיבים שמילאו מהר מהסביר ומעלים חשד לאיכות נמוכה.
שאלה פתוחה
שאלה לטקסט חופשי המאפשרת עומק ותובנות אך מצריכה ניתוח NLP.
שאלה סגורה
שאלה עם סט תשובות קבוע מראש; קלה למדידה והשוואה.
ניתוח טקסט חופשי
קלסיפיקציה, סנטימנט, זיהוי נושאים וישויות כדי להפוך תשובות פתוחות לנתונים שמישים.
מודלי נושאים (Topic Modeling)
זיהוי אוטומטי של קבוצות נושא מרכזיות בטקסט (למשל LDA/BERT-Topic).
חילוץ מילות מפתח (Keyphrase Extraction)
איתור ביטויים מייצגים בתשובות פתוחות לצורך סיכום ותעדוף.
זיהוי ישויות שמיות (NER)
איתור שמות של ישויות כמו מותגים, מקומות ואנשים מתוך טקסט.
תיגון תחבירי (POS Tagging)
סיווג המילים לפי תפקיד דקדוקי (שם עצם, פועל וכו') כדי להבין מבנה.
למטיזציה (Lemmatization)
החזרת מילה לצורת הבסיס שלה לשם נרמול טקסט והשוואה אמינה יותר.
סטמינג (Stemming)
קיצוץ סיומות מילים בצורה חישובית ומהירה כשלב מקדים לניתוח.
מילות עצירה (Stopwords)
מילים שכיחות שאינן תורמות משמעות (כגון "של", "את") ומוסרות בניתוח.
טוקניזציה (Tokenization)
פירוק טקסט ליחידות (מילים/תווים) להכנה לעיבוד סטטיסטי/עצבי.
הטמעות (Embeddings)
ייצוגים מספריים צפופים של טקסט המאפשרים חיפוש סמנטי וה-clustering.
מסד向וקטורים (Vector Database)
בסיס נתונים לחיפושי דמיון לפי וקטורים (Embedding) במקום התאמה מילולית.
חיפוש סמנטי
איתור תשובות/מסמכים לפי משמעות ולא רק לפי מילות חיפוש זהות.
RAG (Retrieval-Augmented Generation)
שילוב החזרה ממאגר ידע עם יצירה בשפה חכמה לקבלת תשובות ממוקדות ומבוססות.
למידת אפס־דוגמאות (Zero-Shot)
ביצוע משימה ללא דוגמאות ממותגות מראש באמצעות הבנה כללית של המודל.
למידת מעט דוגמאות (Few-Shot)
הכוונת מודל בעזרת מספר דוגמאות ספורות כדי לשפר דיוק למשימה ספציפית.
הנדסת פרומפט (Prompt Engineering)
עיצוב הוראות ותבניות קלט למודל שפה כדי לקבל תשובות איכותיות ועקביות.
תבנית פרומפט (Prompt Template)
מבנה קבוע עם משתנים דינמיים ליצירת הוראות סטנדרטיות בסקלת ייצור.
הזיות מודל (Hallucinations)
מצבים שבהם מודל שפה מייצר מידע שגוי או לא מבוסס; מצריך בקרה וייחוס.
הגבהה בקרקע (Grounding)
קישור תשובה למקורות אמיתיים/מידע מוסמך להפחתת הזיות והגדלת אמון.
הסבריות מודלים (XAI)
שיטות שמבהירות למה מודל חזה כך (למשל חשיבות תכונות, דוגמאות דומות).
SHAP
שיטת פילוח תרומת תכונות לחיזוי באמצעות ערכי שאפלי מתורת המשחקים.
LIME
הסבר מקומי של חיזוי על ידי התאמת מודל פשוט סביב נקודת עניין.
סטיית מודל (Model Drift)
ירידת ביצועים לאורך זמן עקב שינוי נתונים או יחסי העולם האמיתי.
סטיית נתונים (Data Drift)
שינוי בהתפלגות התכונות בקלט לעומת ההכשרה; דורש ניטור והתאמות.
סטיית מושג (Concept Drift)
שינוי בקשר בין קלט לפלט (הטארגט) שדורש אימון מחודש או עדכון.
ניטור מודלים (Monitoring)
מעקב רציף אחר דיוק, הוגנות ויציבות כדי לזהות כשלים מוקדם.
קליברציה (Calibration)
יישור ציוני הביטחון של המודל להסתברויות אמיתיות (למשל Platt/Isotonic).
ציון ביטחון (Confidence Score)
מדד לוודאות המודל בחיזוי; משמש לספי החלטה ואוטומציה מבוקרת.
מטריצת בלבול (Confusion Matrix)
טבלת אמת שמשווה חיזויים לתשובות אמת בקטגוריזציה כדי לגזור מדדי ביצוע.
דיוק (Accuracy)
יחס החיזויים הנכונים מכלל הדוגמאות; עלול להטעות בכיתות לא מאוזנות.
דיוק חיובי (Precision)
מתוך מה שסווג כחיובי — כמה באמת חיובי; רגיש להטעיות מסוג I.
רגישות/Recall
מתוך כל החיוביים האמיתיים — כמה זיהינו; רגיש להחמצות (סוג II).
F1
ממוצע הרמוני של Precision ו-Recall; מאזן בין שגיאות מסוג I ו-II.
AUC-ROC
שטח תחת עקומת ROC; מודד יכולת הפרדה בין כיתות בכל סף.
Lift
השוואת שיעור הצלחה ממוקד לעומת בסיס; מודד ערך מוסף של מודל/פילוח.
ולידציה מוצלבת (Cross-Validation)
הערכת מודל על קיפולים שונים של הנתונים כדי למנוע התאמת יתר.
K-Fold
פיצול הנתונים ל-k חלקים, בכל פעם מאמנים על k-1 ובודקים על הנותר.
סט החזקה (Holdout)
חלק נתונים שמור שנעשה בו שימוש רק לבחינת ביצועים סופית.
Train/Validation/Test
פיצול נתונים לשלבי אימון, כיול ובחינה לקבלת הערכה הוגנת.
כיוונון היפר-פרמטרים
חיפוש ערכי פרמטרים חיצוניים למודל (כמו עומק עץ) לשיפור הביצועים.
Grid Search
סריקה שיטתית של כל השילובים המוגדרים להיפר-פרמטרים.
Random Search
דגימה אקראית משטח ההיפר-פרמטרים לקבלת תוצאות טובות מהר יותר.
אופטימיזציה בייסיאנית
חיפוש חכם אחר היפר-פרמטרים תוך שימוש במודל הסתברותי של פונקציית המטרה.
עצירת מוקדמת (Early Stopping)
הפסקת אימון כשביצועי הוולידציה מתדרדרים כדי למנוע התאמת יתר.
התאמת יתר (Overfitting)
מודל שמתאים לרעש בנתוני האימון ומכליל גרוע לנתונים חדשים.
חוסר התאמה (Underfitting)
מודל פשוט מדי שאינו לוכד את הדפוסים, מבצע חלש גם באימון.
רגולריזציה
ענישה על מורכבות מודל (L1/L2) להפחתת התאמת יתר ושיפור הכללה.
הנדסת תכונות (Feature Engineering)
יצירה/עיבוד תכונות משמעותיות מנתוני גלם להעלאת ביצועי מודלים.
בחירת תכונות (Feature Selection)
בחירה בתת-קבוצה אינפורמטיבית של תכונות לצמצום רעש ושיפור מהירות.
הפחתת ממדיות
צמצום מספר התכונות תוך שימור מידע מרכזי לשם ויזואליזציה וחישוביות.
PCA
טרנספורמציה לאורתוגונליות של רכיבים עיקריים שמסבירים את מירב השונות.
t-SNE
הטמעה לא לינארית ל-2/3 ממדים המדגישה מבנים מקומיים בנתונים.
UMAP
שיטת הטמעה מהירה השומרת על מרחקים גלובליים ומקומיים בו-זמנית.
קלאסטרינג (K-Means)
קיבוץ נקודות ל-k אשכולות לפי קרבה גאומטרית למרכזים.
אשכול היררכי
קיבוץ עץ־דמוי המאחד/מפרק אשכולות לפי מרחק בין קבוצות.
DBSCAN
קלאסטרינג מבוסס צפיפות המזהה אזורים צפופים ושומר על רעשים כחריגים.
סיווג (Classification)
הקצאת תווית קטגורית לתצפית (למשל “מרוצה/לא מרוצה”).
רגרסיה (Regression)
חיזוי ערך רציף (למשל ציון שביעות רצון) מתוך תכונות מסבירות.
רגרסיה לוגיסטית
מודל הסתברותי לבחירה בינארית/רב-קטגוריאלית עם פירושיות טובה.
עצי החלטה
מודלים היררכיים של כללי אם-אז; אינטואיטיביים אך נוטים להתאמת יתר.
יער אקראי (Random Forest)
ממוצע של עצים רבים להפחתת שונות ולהגדלת דיוק וחוסן.
Gradient Boosting
אנסמבל עצים שנבנים ברצף לתיקון השגיאות של הקודמים (XGBoost/LightGBM).
רשתות עצביות
מודלים מרובי שכבות הלומדים ייצוגים מורכבים מנתונים.
Transformer
ארכיטקטורה מבוססת תשומת לב (Attention) שהובילה לקפיצה בביצועי NLP.
LLM (Large Language Model)
מודל שפה גדול שאומן על כמויות עצומות של טקסט ומבצע מגוון משימות לשוניות.
כוונון עדין (Fine-Tuning)
התאמת מודל קיים לנתוני־יעד ספציפיים כדי לשפר ביצוע במשימה מוגדרת.
דיסטילציה (Distillation)
העברת ידע ממודל גדול לקטן ומהיר יותר תוך שמירת ביצועים.
העשרת נתונים (Data Augmentation)
יצירת וריאציות סינתטיות לנתונים קיימים כדי לחזק מודלים ולמנוע הטיות.
אנונימיזציה
הסרת מזהים אישיים כך שלא ניתן לשחזר זהות משתתף.
פסאודונימיזציה
החלפת מזהים אישיים במזהים חלופיים השמורים בנפרד לצורכי אבטחה.
פרטיות דיפרנציאלית
הוספת רעש סטטיסטי כדי למנוע חשיפת מידע על פרט בודד בניתוחים.
k-אנונימיות
הבטחה שכל רשומה אינה ניתנת לזיהוי מבין פחות מ-k רשומות דומות.
l-דיוורסיטי
הרחבת k-אנונימיות בכך שבכל קבוצה יש גיוון של ערכי תכונה רגישה.
צמצום נתונים (Data Minimization)
איסוף רק של המידע הנדרש לצורך המוצהר — עקרון יסוד בתקנות פרטיות.
ניהול הסכמה (Consent)
תיעוד וקבלת אישור מפורש לשימוש בנתונים, כולל אפשרות למשיכה.
GDPR
תקנת ההגנה האירופית על פרטיות המגדירה זכויות נבדקים וחובות מעבדים.
CCPA/CPRA
חוקי פרטיות בקליפורניה המעניקים לצרכנים שליטה רחבה בנתוניהם.
DPIA
הערכת השפעת הגנת פרטיות לפרויקטים עם סיכון גבוה לנתונים אישיים.
קצין הגנת מידע (DPO)
אחראי ארגוני על תאימות פרטיות, פניות נבדקים וניהול סיכונים.
RBAC
בקרת גישה מבוססת תפקידים המגדירה מי יכול לראות/לערוך איזה נתונים.
SSO/SAML
הזדהות יחידה לארגונים דרך פרוטוקולים סטנדרטיים לחוויית כניסה רציפה.
OAuth 2.0
מנגנון הרשאה מאובטח ליישומים לצרוך API בשמך ללא שיתוף סיסמה.
JWT
טוקן חתום דיגיטלית להעברת תביעות זהות/הרשאה בין שירותים.
הצפנה במנוחה (Encryption at Rest)
הצפנת נתונים המאוחסנים בדיסק כדי למנוע גישה לא מורשית.
TLS
פרוטוקול להצפנת תקשורת בין דפדפן לשרת (HTTPS) להגנת נתוני סקר.
וובהוקים (Webhooks)
קריאות חיצוניות בזמן אמת לאחר אירועים (למשל השלמת סקר) לסנכרון מערכות.
API
ממשק תכנות המאפשר כתיבה/קריאה של סקרים, תגובות ותובנות ממערכת חיצונית.
SDK
ערכת פיתוח לקוחות/שרת לשילוב מהיר של יכולות סקר ובינה במוצרים.
יומן ביקורת (Audit Log)
רשימת פעולות מפורטת לצורכי שקיפות, תאימות ובדיקת תקלות.
מדיניות שימור נתונים
כללים מתי למחוק/לאנונימיזציה של תגובות בהתאם לחוק ולצרכים עסקיים.
ממשל נתונים (Data Governance)
מסגרת מדיניות, תהליכים ותפקידים לניהול איכות, אבטחה ושימוש בנתונים.
אגם נתונים (Data Lake)
מאגר בקנה מידה גדול לנתוני גלם מובנים/לא מובנים לניתוח גמיש.
מחסן נתונים (Data Warehouse)
מאגר מובנה ל-BI ודוחות עם מודלים עקביים ותצוגות מצטרפות.
ETL/ELT
תהליכי חילוץ, טרנספורמציה וטעינה של נתונים למאגרי ניתוח.
ניתוח קוהורטות (Cohort Analysis)
מעקב אחר קבוצות משיבים לאורך זמן כדי לזהות שינויים בדפוסי התנהגות.
סגמנטציה (Segmentation)
חלוקת קהל לקבוצות הומוגניות כדי להתאים מסרים ומוצרים.
פרסונות
דמויות מייצגות המבוססות על נתונים המסייעות לתכנן חוויות ומוצרים.
חיזוי נטישה (Churn Prediction)
מודלים המזהים מי צפוי לנטוש כדי לאפשר פעולות מניעה ממוקדות.