שלב 1

גיבוש השערה לפני הבדיקה

A/B Test שמתחיל ב"בואו נשנה את הצבע" הוא בזבוז תנועה. כל בדיקה חייבת להתחיל בהשערה: "אם נשנה [X] ל-[Y], נצפה שה-CVR יעלה כי [סיבה]." לדוגמה: "אם נחליף את הכותרת מ'מוצר X בהנחה' ל'פתרון לבעיית Y', ה-CVR יעלה כי המבקרים מחפשים פתרון לבעיה, לא מוצר." בלי השערה, גם אם B מנצח, לא לומדים כלום ולא ניתן לחזור על ההצלחה.

שלב 2

מה לבדוק ראשון: סדר עדיפויות

בדקו לפי השפעה פוטנציאלית, לא לפי מה שקל לשנות. סדר נכון: (1) כותרת ראשית: שינוי כותרת מזיז CVR ב-10-25% בממוצע. (2) הצעת ערך: מה מבדיל אתכם ואיך מציגים זאת. (3) CTA: טקסט, צבע, מיקום. (4) Social proof: מיקום ביקורות, כמה מוצגות. (5) תמונת Hero: מוצר מול אדם משתמש במוצר. (6) מחיר ותנאי משלוח: Free shipping לעומת מחיר משלוח גלוי. אל תבדקו צבע כפתור לבד כשהכותרת עדיין לא עובדת.

שלב 3

כמה תנועה צריך לפני שמחליטים

הכלל: לפחות 100 המרות לכל גרסה, ולא פחות משבועיים. לחנות עם CVR של 2%, צריך 5,000 ביקורים לכל גרסה לפני שמחליטים. עם CVR של 1%, צריך 10,000 ביקורים לכל גרסה. כלי חישוב: השתמשו ב-AB Test Sample Size Calculator (Evan Miller) לפני שמתחילים. הגדירו את ה-CVR הנוכחי ואת השיפור המינימלי שרוצים לזהות (MDE: Minimum Detectable Effect). פחות מ-100 המרות לגרסה = לא מובהק סטטיסטית.

שלב 4

כמה זמן מריצים בדיקה

מינימום שבועיים, מקסימום 4-6 שבועות. פחות משבועיים מחמיץ תנודות יומיות ושבועיות: ימי שישי שונים מימי שני, שעות שיא שונות. גם אם הגעתם ל-100 המרות אחרי 5 ימים, המשיכו עד שבועיים. מעל 6 שבועות: תנועה שנחשפת לגרסה הישנה ממושך מאבדת ייצוגיות, ו-Creative Fatigue בצד המודעה משבש את ה-Mix. עצרו מוקדם רק אם: גרסה B גרועה בצורה קיצונית (CVR נמוך ב-30%+ למשך 5+ ימים) כדי לחסוך תנועה.

שלב 5

Statistical Significance: מה זה ואיך קוראים

Statistical Significance היא הסבירות שהתוצאה שמדדתם אינה מקרית. 95% Confidence הוא הסטנדרט: פירושו שיש 5% סיכוי בלבד שההבדל שמדדתם מקרי. כלים כמו Google Optimize, VWO, ו-AB Tasty מחשבים את זה אוטומטית. טעות נפוצה: לעצור ברגע ש-B נראה מנצח לפי הכלי. הסיבה: כלים רבים מציגים Confidence בזמן אמת שמשתנה. חכו עד שהמספרים מתייצבים ושבועיים חלפו. 90% Confidence הוא סביר לשינויים קטנים, 95% לשינויים עם השפעה תקציבית.

שלב 6

פילוח תוצאות לפי מקור תנועה

תוצאה מצוינת לתנועת Google Shopping עשויה להיות גרועה לתנועת Meta Broad. תמיד פלחו לפי: מקור (Google Ads, Meta, Organic), מכשיר (Mobile vs Desktop, Mobile מהווה לרוב 60-70% מהתנועה ו-CVR שונה מהותית), ולפי קמפיין אם יש הבדלים בכוונת קנייה. דוגמה מהשטח: גרסה B עם כותרת "משלוח חינם ב-24 שעות" הכפילה CVR ממשתמשי Mobile, אך לא עשתה הבדל ב-Desktop. ממוצע כולל הסתיר את הממצא.

שלב 7

כלים לניהול A/B Tests

לחנויות Shopify: Shogun, Zipify Pages, ו-PageFly תומכים ב-A/B Testing מובנה. Google Optimize סגרה (2023) אז גם VWO, Optimizely, ו-AB Tasty הן אפשרויות נפוצות. הכי פשוט לחנות קטנה: Hotjar להבנת התנהגות + Google Analytics 4 לבדיקת CVR לפי דף. אם תקציב פיתוח קיים, בדיקות Server-side (בקוד) מדויקות יותר מבדיקות Client-side (JavaScript) כי מהירות טעינה זהה לשתי הגרסאות.

מה לבדוק קודם: טבלת עדיפויות

אלמנט השפעה ממוצעת על CVR קושי יישום בדקו
כותרת ראשית 10-25% נמוך ראשון
הצעת ערך (Hero) 8-20% בינוני שני
CTA: טקסט ומיקום 5-15% נמוך שלישי
Social Proof 5-12% נמוך רביעי
תמונת Hero 3-10% בינוני חמישי
צבע כפתור 0-3% נמוך אחרון

רוצים לדעת איפה דפי הנחיתה שלכם מפסידים המרות?

COREPPC מזהה בעיות ביצועים ב-Google Ads ו-Meta Ads אוטומטית ב-5 דקות.

הריצו ביקורת חינמית

שאלות נפוצות

מינימום 100 המרות לכל גרסה לפני שמכריעים. לחנות עם CVR של 2%, זה אומר לפחות 5,000 ביקורים לכל גרסה. עם פחות תנועה, התוצאות לא יגיעו לרמת מובהקות סטטיסטית של 95% והחלטה תתבסס על רעש, לא נתונים.

מינימום שבועיים, גם אם הגעתם ל-100 המרות מוקדם יותר. פחות משבועיים מחמיצים תנודות יומיות. מקסימום 4-6 שבועות: אחרי זה נשחקת הגרסה הישנה ותנועה שנחשפת לה ממושך מאבדת ייצוגיות.

כותרת ראשית קודם, תמיד. הכותרת היא הדבר הראשון שהמבקר קורא וקובעת אם הוא ממשיך לקרוא. שינוי כותרת יכול להזיז CVR ב-10-25%. אחרי כותרת: הצעת ערך, ואז CTA. תמונה לבד היא מהשינויים שמשפיעים פחות.

כן. מודעה מקבלת תנועה מהרבה מקורות ומבחנים קצרים יותר. דף נחיתה מושפע ממקור התנועה: מבקר מ-Google Shopping מגיע עם כוונת קנייה גבוהה, מבקר מ-Broad Meta מגיע עם כוונה נמוכה. חשוב לפלח תוצאות לפי מקור תנועה.

Statistical Significance הוא הסבירות שהתוצאה שמדדתם אינה מקרית. 95% Confidence הוא הסטנדרט: אומר שיש רק 5% סיכוי שההבדל שמדדתם נובע ממקרה. בלי זה, גרסה B שנראית מנצחת עשויה להיות גרועה יותר עם עוד תנועה.