פיתוי הבינה המלאכותית הסינית: אל לה לישראל להסתכן בשיכרון מעמקים בעקבות DeepSeek - המכון למחקרי ביטחון לאומי
לך לחלק עליון לך לתוכן מרכזי לך לחלק תחתון לך לחיפוש
לוגו INSS המכון למחקרי ביטחון לאומי, מחקר אסטרטגי, חדשני ומכוון מדיניות- מעבר לדף הבית
המכון למחקרי ביטחון לאומי
לוגו אוניברסיטת תל אביב - מעבר לאתר חיצוני, נפתח בעמוד חדש
  • צור קשר
  • English
  • תמכו בנו
  • מחקר
    • נושאים
      • ישראל בזירה הגלובלית
        • יחסי ישראל-ארצות הברית
        • מרכז גלייזר למדיניות ישראל-סין
        • רוסיה
        • אירופה
      • איראן והציר השיעי
        • איראן
        • לבנון וחזבאללה
        • סוריה
        • תימן והחות'ים
        • עיראק והמיליציות השיעיות העיראקיות
      • מסכסוך להסדרים
        • יחסי ישראל-פלסטינים
        • רצועת עזה וחמאס
        • הסכמי שלום ונורמליזציה במזרח התיכון
        • סעודיה ומדינות המפרץ
        • טורקיה
        • מצרים
        • ירדן
      • מדיניות הביטחון הלאומי של ישראל
        • צבא ואסטרטגיה
        • חוסן חברתי והחברה הישראלית
        • יחסי יהודים-ערבים בישראל
        • אקלים, תשתיות ואנרגיה
        • טרור ולוחמה בעצימות נמוכה
      • המחקר העל-זירתי
        • המרכז לאיסוף וניתוח נתונים
        • משפט וביטחון לאומי
        • טכנולוגיות מתקדמות וביטחון לאומי
        • תודעה והשפעה זרה
        • כלכלה וביטחון לאומי
    • פרויקטים
      • מניעת הגלישה למציאות של מדינה אחת
      • אנטישמיות בת-זמננו בארצות הברית
      • תפיסות ביחס ליהודים ולישראל במרחב הערבי-מוסלמי והשפעותיהן על המערב
  • פרסומים
    • -
      • כל הפרסומים
      • מבט על
      • ניירות מדיניות
      • פרסום מיוחד
      • עדכן אסטרטגי
      • במה טכנולוגית
      • מזכרים
      • פוסטים
      • ספרים
      • ארכיון
  • נתונים
    • סקרים
    • זרקור
    • מפות
    • חרבות ברזל - תמונת מצב מתעדכנת
  • אירועים
  • צוות
  • אודות
    • חזון וייעוד
    • קורות המכון
    • המחקר
    • הדירקטוריון
    • הדרכה ולמידה
    • התמחות במכון
    • מלגות ופרסים
    • דיווח לרשות התאגידים
  • מדיה
    • תקשורת
      • רדיו וטלוויזיה
      • מאמרים
      • ראיונות
    • וידאו
    • הודעות לעיתונות
  • פודקאסט
  • ניוזלטר
חדש
חיפוש באתר
  • מחקר
    • נושאים
    • ישראל בזירה הגלובלית
    • יחסי ישראל-ארצות הברית
    • מרכז גלייזר למדיניות ישראל-סין
    • רוסיה
    • אירופה
    • איראן והציר השיעי
    • איראן
    • לבנון וחזבאללה
    • סוריה
    • תימן והחות'ים
    • עיראק והמיליציות השיעיות העיראקיות
    • מסכסוך להסדרים
    • יחסי ישראל-פלסטינים
    • רצועת עזה וחמאס
    • הסכמי שלום ונורמליזציה במזרח התיכון
    • סעודיה ומדינות המפרץ
    • טורקיה
    • מצרים
    • ירדן
    • מדיניות הביטחון הלאומי של ישראל
    • צבא ואסטרטגיה
    • חוסן חברתי והחברה הישראלית
    • יחסי יהודים-ערבים בישראל
    • אקלים, תשתיות ואנרגיה
    • טרור ולוחמה בעצימות נמוכה
    • המחקר העל-זירתי
    • המרכז לאיסוף וניתוח נתונים
    • משפט וביטחון לאומי
    • טכנולוגיות מתקדמות וביטחון לאומי
    • תודעה והשפעה זרה
    • כלכלה וביטחון לאומי
    • פרויקטים
    • מניעת הגלישה למציאות של מדינה אחת
    • אנטישמיות בת-זמננו בארצות הברית
    • תפיסות ביחס ליהודים ולישראל במרחב הערבי-מוסלמי והשפעותיהן על המערב
  • פרסומים
    • כל הפרסומים
    • מבט על
    • ניירות מדיניות
    • פרסום מיוחד
    • עדכן אסטרטגי
    • במה טכנולוגית
    • מזכרים
    • פוסטים
    • ספרים
    • ארכיון
  • נתונים
    • סקרים
    • זרקור
    • מפות
    • חרבות ברזל - תמונת מצב מתעדכנת
  • אירועים
  • צוות
  • אודות
    • חזון וייעוד
    • קורות המכון
    • המחקר
    • הדירקטוריון
    • הדרכה ולמידה
    • התמחות במכון
    • מלגות ופרסים
    • דיווח לרשות התאגידים
  • מדיה
    • תקשורת
      • מאמרים
      • ראיונות וציטוטים
      • רדיו וטלוויזיה
    • וידאו
    • הודעות לעיתונות
  • פודקאסט
  • ניוזלטר
  • צור קשר
  • English
  • תמכו בנו
bool(false)

פרסומים

דף הבית פרסומים מבט על פיתוי הבינה המלאכותית הסינית: אל לה לישראל להסתכן בשיכרון מעמקים בעקבות DeepSeek

פיתוי הבינה המלאכותית הסינית: אל לה לישראל להסתכן בשיכרון מעמקים בעקבות DeepSeek

עד כמה חזק ויעיל מודל הבינה המלאכותית הסיני – ומה המסקנות שצריך להסיק בישראל?

מבט על, גיליון 1951, 18 בפברואר 2025

English
אריאל סובלמן
מיכאל גנקין

תחרות המעצמות לעליונות בבינה המלאכותית שועטת קדימה והמהלומה האחרונה של סין – השקת מודל הבינה המלאכותית DeepSeek – הביאה לטלטלה עזה ברחבי העולם. תעשיית הטכנולוגיה, בורסות המניות, אקדמיה וממשלות בוחנות האם פריצת הדרך ההנדסית הסינית תגרום גם לשינוי המאזן הגיאו-פוליטי. בצל קשיי תכנית הבינה הלאומית הישראלית, נבחנת במאמר זה יעילות המודל הסיני החדש ועלותו האמיתית מול זו שהתפרסמה. מסקנת המחברים היא כי אסור להסתנוור מהפיתוחים הסיניים ולהתפתות לקיצורי דרך טכנולוגיים על חשבון הקמת תשתית טכנולוגיה לאומית וביצור ריבונותה הדיגיטלית של ישראל.


קצב האירועים בתחום הבינה המלאכותית ממשיך להדהים ולהכות גלים ברחבי העולם.  ההתפתחות המשמעותית האחרונה נרשמה עם השקתו של מודל בינה מלאכותית בשם R1 שיצרה חברת DeepSeek הסינית בסוף ינואר 2025, בצמוד להשבעת טראמפ לנשיא ארצות הברית וחגיגת ראש השנה הסיני. השיח התקשורתי המערבי על אודות המודל התמקד בעלות האימון הנמוכה עד כדי להדהים אשר פורסם כי עמדה, לכאורה, על פחות משישה מיליון דולר, ביעילותו החישובית, הגדולה משמעותית ממודלים מערביים מתחרים, ובעלות השימוש המסחרי בו, הנמוכה בעשרות אחוזים ממחירי השוק הנוכחיים של החברות המתחרות דוגמת  ChatGPT  הפופולרי.[1]  מיד עם השקתֿו עלתה טענה כי לפריצת דרך מדעית והנדסית כזו יש משמעויות הרבה מעבר לטכנולוגיה עצמה.  לפי אומדני הביצועים של החברה עולה שסין, הנתונה למשטר קשוח של הגבלות ייצוא אמריקאיות, או עקפה אותן, או – מדהים אף יותר -  הצליחה בכוחות עצמה להגיע לפריצת הדרך באמצעות כלי מחשוב מדורות ישנים שכבר יש ברשותה ואינם כפופים למשטר הפיקוח. עד לחשיפת DeepSeek R1, הנחת היסוד בעולם הטכנולוגיה הייתה שעל מנת לבצע את כמות החישובים העצומה הנדרשת למערכות בינה מלאכותית, אין ולא יהיה תחליף למעבדים המתקדמים ביותר, המיוצרים רובם כולם על ידי חברות במערב, בראשן חברת nVidia האמריקאית.  התגובות הראשונות בעולם היו קיצוניות והיו אף אלה שהשוו את ההפתעה לשיגור לווין הספוטניק הסובייטי ב- 1958 וכינו את המעמד ״רגע ה-DeepSeek״ או "רגע הספוטניק של הבינה המלאכותית".[2] ואכן, תגובת השווקים להכרזה הייתה מיידית ומניות ענקיות הטכנולוגיה ברחבי העולם רשמו ירידות חדות שגרמו להפסדים עצומים.

מאז ההשקה ניצת דיון ציבורי חובק עולם על אודות המשמעויות הטכנולוגיות וההשלכות הגיאו-פוליטיות בתחרות בין סין לארצות הברית על ההובלה הטכנולוגית.  הדיון לא פסח על ישראל, הנתונה במשבר משל עצמה בתחום הבינה המלאכותית, כשדירוגה במדדים העולמיים נמצא בירידה מתמדת והתוכניות הלאומיות בתחום מתקשות לממש את יעודן לאפשר לתעשייה הישראלית להשיג מקום מוביל, כפי שהצליחה בגלים קודמים של טכנולוגיות מפציעות, תחום הסייבר למשל.

חמור מכך, מעמדה של ישראל נפגע קשות בשבוע האחרון לכהונתו של הנשיא ביידן, שהוציא צו המדרג את מדינות העולם לפי נכסיותן הטכנולוגית, מידת האמון בהן והתייצבותן לצד ארצות הברית בתחרות מול סין. בדרג א׳ יש 18 מדינות, אשר ארצות הברית מחשיבה כבעלות בריתה האמינות ביותר מחד גיסא, ושהן נתפסות גם כנכסיות ביותר לשיתוף פעולה סביב בינה מלאכותית וטכנולוגיות מתקדמות, מאידך גיסא.  דרג ג׳ כולל את סין, רוסיה, איראן וצפון קוריאה, שחל איסור מוחלט על ייצוא טכנולוגיה לבינה מלאכותית אליהן. על פי הצו, ארצות הברית תשית הגבלות על ייצוא מעבדים מתקדמים המאפשרים פיתוחי בינה מלאכותית למדינות בדרג ב', והגבלות אלו כוללות – לראשונה - גם את ישראל. מבחינות מסוימות, ישראל סופגת נזק אגבי ניכר מהתחרות בין ארצות הברית לסין. אך זהו הסבר חלקי ומקל מכיוון שהסיבות להכללתה ברשימת המדינות המוגדרות רשמית כדרג ב' הן עמוקות יותר ונוגעות בהיבטים רחבים בהרבה, ובעצם מהוות הבעת אי-אמון אמריקאית ביכולתה של ישראל לפתח טכנולוגיית בינה המלאכותית מתקדמת, או באופן שאינו פוגע ביעדים האסטרטגיים של ארצות הברית. מן הסתם, זהו גם מעגל קסמים שלילי, מכיוון שהכללתה של ישראל בדרג ב׳ והגבלות היצוא שיחולו עליה יביאו למצב שללא גישה מספקת לשבבים מתקדמים יהיה קשה אף יותר לפתח את תכנית הבינה המלאכותית ולמנוע את המשך הירידה בדירוגים העולמיים.  הצו של הנשיא ביידן הביא את ישראל, לראשונה, להכיר בחומרת המצב והניע פעילות אינטנסיבית בממשלה, כנסת, תעשייה ומערכת הביטחון, שתכליתה למצוא דרך להתמודד עם האתגר, לנסות להשפיע על הנשיא הנכנס טראמפ לבטל את הנחיית קודמו (דבר שראש הממשלה נתניהו אכן עשה בביקורו בוושינגטון בתחילת פברואר. נותר עוד לראות האם הנשיא ייעתר בחיוב לבקשתו להחריג של ישראל מההגבלות), או, לחילופין, לגבש תכנית שתעלה את ישראל לדרג א׳.

לנוכח ההקשר הרחב והלך הרוח בישראל אחרי הצו של ביידן, קל להבין איך ההכרזה הסינית הציתה באחת תקווה גם בישראל שאם סין הצליחה לפתח מודל בינה מלאכותית מוביל בעלות זולה ובלי גישה למעבדים מתקדמים – אזי ייתכן שגם ישראל תוכל להצליח באותה השיטה. המעבר מפסימיות קיצונית בעקבות המהלך של ביידן לאופטימיות אופורית אחרי ההכרזה הסינית שיקף, למעשה, את מטוטלת הרגשות הישראלית.  לדוגמא, כבר ביום הכרזת הצו, איגוד התעשיינים בישראל יצא בקריאה דחופה לראש הממשלה לטפל במשבר, שיפגע אנושות בתעשיית הטכנולוגיה הישראלית. כשבוע לאחר מכן, המגמה התהפכה ומשרד החדשנות והמדע הזדרז להתייחס להשקת המודל R1  של DeepSeek בציינו כי ״עבור ישראל, המודל הסיני מסמן אופק חיובי באשר לסיכוייה להיות מהמובילות בבינה מלאכותית בעולם גם ללא השקעות עתק, שהיוו עד עתה חסם כניסה משמעותי למועדון זה באופן עצמאי״.[3]

המציאות, כמובן, מורכבת יותר ודורשת העמקה טכנית, ניתוח גיאו-אסטרטגי והערכת המשמעויות עבור ישראל. מאמר זה מתמקד בשלושה נושאים עיקריים אלה. הראשון, בחינה טכנית מעמיקה של המודל הסיני החדש, עוצמת החישוב שלו וניתוח עלותו האמיתית מול זו שהתפרסמה. לאחר מכן, נבחן האם פריצת הדרך הסינית אכן עשויה לערער את יסודות התחרות הטכנולוגית בין סין לארצות הברית והאם ניתן להסיק גם על יעילות משטר הפיקוח וההגבלות האמריקאי,  שייתכן שמיצה את עצמו. כנגזרת של שני ממדים אלה, ייסקרו המשמעויות לישראל ובכללן האם אכן השקת DeepSeek טומנת בחובה הזדמנות עבור ישראל, והאם בעקבותיה יש תוחלת ממשית שעשויה לאפשר לישראל להגיע לעמדת הובלה בבינה מלאכותית בלי להיזקק למעבדים המתקדמים ביותר, אשר כיום אינם זמינים לה עקב מיקומה בדרג ב' וההגבלות האמריקאיות.

עד כמה חזק ויעיל DeepSeek ומה היתה עלות פיתוחו האמיתית?

הסוגייה הראשונה היא האם יכולות Deep Seek ועוצמתו הן כפי שנטען על ידי החברה הסינית עצמה בפרסומיה, או פרסומים וניתוחים טכניים מערביים, שבעצם התבססו על נתוני החברה שפורסמו (ולא על בדיקות עצמאיות). ככל שחולפים הימים ומתבררים  נתוני אמת כתוצאה מבדיקות עומק, התמונה מתבהרת מעט. בדיקות עצמאיות ראשונות מעידות כי ייתכן שביצועי המודל אינם טובים כפי שנטען על ידי החברה בעת פרסומו.[4]  בחינה מדוקדקת של הפרטים הטכניים שפורסמו על המודל מגלה כי אומנם הארכיטקטורה של DeepSeek מייצרת ייעול עלויות אימון משמעותי, אבל היא לא עושה זאת בזכות הצגת רעיון חדש, אלא באמצעות שילוב יצירתי של רעיונות קיימים  –  כולם כאלה שמומשו בעבר על ידי חברות מערביות.[5] ובייחס לטענה כי הצלחת DeepSeek מעידה כי משטר הגבלות הייצוא האמריקאי נכשל בהשגת מטרותיו (מניעת הובלה סינית בתחום השבבים והבינה המלאכותית), יש לזכור כי  חברת DeepSeek עצמה חשפה כי המודל אומן באמצעות מעבדים שנרכשו לפני כניסת הגבלות הייצוא לתוקפן באוקטובר 2023, ולכן השפעתן טרם מורגשת במוצרים הנוכחיים.[6] יתרה מכך, בראיון שקיים לאחרונה, מנכ"ל DeepSeek, הוא ציין כי להערכתו, המגבלה המשמעותית ביותר שהחברה צפויה להתמודד איתה בעתיד הנראה לעין היא זמינות מעבדים לאימון והפעלת המודלים שלה.[7]

בסוגיית העלות, בשורה התחתונה, DeepSeek הצהירה ש״הוא״ עלה פחות משישה מליון דולר. אך קריטי להדגיש כי הנתון הזה הוא רק של העלות הסופית של אימון המודל, ללא רכיב התשתיות או עלות הפעלתו. מעבר לכך, חברת DeepSeek השיקה שני מודלים של בינה מלאכותית במקביל, R1 - שהוא מודל הסקה (Reasoning) ו-V3 - שהוא מודל שפה (LLM). סכום השישה מיליון דולר שהחברה נקבה בו מתייחס ספציפית למודל V3, וזאת בעוד שההפתעה המשמעותית יותר הייתה  דווקא מביצועי המודל R1.  את העלויות של מודל R1 החברה הסינית לא חשפה.  העלות האמיתית של אימון מודל V3 מוערכת בחצי מיליארד דולר, הכוללים את עלות חוות השרתים, מעבדים, חשמל וכח אדם - רכיבים שהם בלתי ניתנים להפרדה מחישוב העלויות האמיתיות וכלולות בעלויות האימון, שאותן נוהגות לדווח חברות מערביות.[8]

כשניגשים לחישוב סדור יותר של עלויות האימון עצמן, רואים כי מחירי האימון המצוטטים (כ-5.6 מיליון דולר ו/או כ-2.8 מיליון שעות או 57 ימי מעבד) בוצעו באמצעות מחשב על המונה 2048 מעבדי H800 של חברת nVidia והם מתייחסים למודל שפה גדול (LLM) קודם של החברה אשר שוחרר בסוף דצמבר 2024 – DeepSeek V3. לטענת DeepSeek, מודל זה משיג ביצועים מקבילים או טובים יותר בהשוואה למודלי ה-LLM המובילים של חברות מערביות, ביניהן OpenAI GPT 4o, META Llama 3.1 405B ו-Anthropic Claude 3.5 Sonnet.[9] לשם השוואה, בעת פרסום מודל ה-LLM Llama 3.1 405B ביולי 2024, חברת META הצהירה כי נדרשו כ-30.8 שעות אימון באמצעות מחשב על המונה כ-16,000 מעבדי H100 של חברת nVidia – בעלות אימון משוערת של 92.4 מיליון דולר.[10] עלות האימון המשוערת של מודל GPT 4o, אשר שוחרר במאי 2024, היא כ-78  מיליון דולר.[11] על פניו, נתונים אלו אכן מראים כי עלותו של המודל V3 הינה נמוכה בסדר גודל, ועוד על בסיס עוצמת חישוב מופחתת שהייתה זמינה לסינים. וזה אכן הנרטיב הראשוני שהתקבע.

אך יש להאיר מספר סייגים. ראשית, בתעשיית בינה המלאכותית מקובלת מגמה של שיפור ביצועי אימון והסקה של פי 3 בשנה, אשר ניתן להגיע אליהם רק משיפורי תוכנה ואלגוריתמיקה (דהיינו, בלי שימוש בשבבים חדשים). השיפורים של DeepSeek תואמים את קו המגמה הכללית ולכן יש לשקלל נתון זה כשבודקים עד כמה החברה פרצה דרך.   בנוסף, מעבדי H800, שDeepSeek- הצהירה כי היא משתמשת בהם, אינם "גרסה מוחלשת" של מעבדי H100 הנחשבים "מעבדים מתקדמים" (ומוטלות עליהם מגבלות ייצוא), אלא גרסה מיוחדת המותאמת לייצוא לנוכח ההגבלות של הממשל האמריקאי לפני אוקטובר 2023.  על מנת לעמוד בהגבלות שקבע הממשל, חברת nVidia פיתחה שבב המאפשר ביצועים דומים באימון מודלים קטנים, אבל לא באימון מודלים גדולים.

מבחינת עוצמת החישוב העומדת לרשות חברת DeepSeek, הערכות שונות גורסות כי בידיה כ-50,000 מעבדי nVidia Hopper (כלומר H100, H800 או H20) בנוסף למחשב בעל כ-10,000 מעבדי nVidia A100.[12] מעבר לכל אלה, עלו השערות והאשמות שלפיהן ייתכן ש-DeepSeek משתמשת גם בשבבים המתקדמים ביותר, דוגמת  , H100שייתכן שהצליחה להבריח לתוך סין תוך עקיפת הגבלות היצוא והפיקוח. אין בשלב זה אפשרות להפריך או לאשש את הטענות הללו ולכן, כלל החישובים במאמר זה מתבססים על הנחה שדיווחי החברה על אודות משאבי המחשוב העומדים לרשותה הם אמיתיים ואמינים.

אם לפשט את הנתונים, אפשר לסכם אותם בכך שנראה שחברת DeepSeek אכן ביצעה התקדמות הנדסית מרשימה מאוד, אבל הפרשנויות שפורסמו בתקשורת על אודות המשמעויות שלה, ובפרט ההשוואה לביצועי מודלים מערביים הינן מוגזמות. DeepSeek לא הצליחה להראות שיפור מהותי מעבר לקו המגמה המקובל בעולם ולא הייתה פריצת דרך מדעית יסודית שמרעידה את אמות הסיפים של עולם האלגוריתמיקה וההנדסה.

החולשה המשמעותית ביותר ב-DeepSeek היא שהועלמו לחלוטין רכיבי התשתית שנדרשה – בראשם עוצמת החישוב והעלות הכוללת האמיתית של ייצור המודל, וכן הניסיון לגרום לעולם לחשוב שהייתה פריצת דרך על גבול האלכימיה, שבאמצעותה ניתן לבצע כמות חישובים עצומה באמצעות טכנולוגיות ישנות יחסית. כקנה מידה לעוצמת המחשוב האמיתית שהראנו בפרק זה, ניתן להשוותה לעוצמת החישוב המצופה ממחשב העל הישראלי, הנמצא כיום בשלבי מכרז.

בשנת 2021, מדינת ישראל החליטה להקים מעבדה לאומית לפיתוח מחשב-על שיעניק שירותי חישוב מתקדמים לצורכי המדינה והציבור. עתה נערוך השוואה בין המשאבים שנדרשו לפיתוח המודלים המדוברים של חברת DeepSeek לבין יכולותיו של מחשב העל הלאומי, המתוכנן לקום בישראל באמצעות מכרז של רשות החדשנות.

לפי התוכנית, במהלך 2026 אמור לקום מחשב שיידע לספק כ-75% מעוצמת החישוב שנדרשה על מנת לאמן את המודלים של DeepSeek (החישוב מתבסס על הערכה של  כ-1500 מעבדיH100  במחשב הישראלי, לעומת 2048 מעבדי H800 במחשב הסיני המספקים ביצועי חישוב דומים) ולכל היותר יספק 44% מעוצמת החישוב (המוצהרת, בהנחה שאין לה עוד יכולות שהוסתרו, למשל כדי לא לחשוף הפרת סנקציות) הזמינה לה כעת. יתרה מכך, אם נשקלל את קו המגמה הכללי של עליה בדרישות המחשוב עבור מודלים גדולים מחד גיסא, והגידול במשאבי המחשוב של חברות הבינה המלאכותית, שממשיך וימשיך בפרק הזמן עד להקמתו בפועל של מחשב העל הלאומי, הרי שהפער בין יכולות המחשב לבין צורכי השוק הולך ומתרחב. לכן, למרות שיפורים אלגוריתמיים או רעיונות מפציעים לשיפור יעילות, מחשב העל הלאומי לא ידע לתת מענה תחרותי לאימון מודלים דוגמתR1  של DeepSeek, גם כאשר יפעל במלוא תפוקתו. כשם ש"חוק מור" מתאר דפוס קבוע בתעשייה של מזעור רכיבים כל שנתיים בשעה שתפוקתם מוכפלת, כך "פרדודקס ג׳בונס" מראה כי יעילות שימוש במשאב אינה מביאה להקטנת השימוש בו, אלא להיפך – השימוש בו גדל יותר מאשר קצב ההתייעלות, וחוזר חלילה. במקרה של DeepSeek, ניתן לחזות, אם כך, כי ההתקדמות בייעול החישוב לא צפויה להקטין את הדרישה למשאבי מחשוב (במקרה זה שבבים), אלא להגדיל את הדרישה להם.  כשחלחלה ההבנה הזו בעולם, החרדה לעתידן של חברות השבבים נעלמה בהתאמה, הירידות החדות במניות של חברות דוגמת nVidia אחרי השקת DeepSeek נבלמו  ושוויין חזר ועלה.

לסיכום נושא זה, להערכתנו, בחישוב האופטימי ביותר, DeepSeek נדרשה לעוצמת חישוב גדולה פי 2 מעוצמתו המקסימלית של מחשב העל המתוכנן.  בחישוב מחמיר יותר, יתכן שעוצמת החישוב שנדרשה ועמדה לרשות DeepSeek גדולה כמעט פי 10.  מכאן אנו מסיקים, שתהיה זו טעות לתלות תקוות ב-DeepSeek ולראות בה מודל שיוכל לשרת את ישראל ולאפשר לה להגיע להישגים בבינה מלאכותית בלי להשקיע בתשתיות הנדרשות.

משמעויות

כמצוין בראשית הדברים, יש שלושה ממדים עיקריים להתפתחויות, הממד הטכנולוגי עצמו, הממד הגיאו-אסטרטגי וזה הישראלי.

את הממד הטכני עצמו סקרנו והצגנו את הפערים בין התפיסות לגבי DeepSeek  לבין הביצועים והעליות האמיתיים. בממד הגיאו-אסטרטגי עולות מספר מסקנות אפשריות לגבי יעילות הפיקוח האמריקני. מפתה לחשוב שהפיקוח כשל, אבל זו מסקנה פשטנית, בראש ובראשונה מכיוון שמרבית ההצלחה של DeepSeek מבוססת על טכנולוגיה ורכיבים שהחברה השיגה לפני שההגבלות הנוכחיות הושתו. מסקנה מדויקת יותר תהיה שמשטר הפיקוח בעצם הצליח טוב מדי וגרם לאפקט לא צפוי, מכיוון שהוא אילץ את סין לחפש ולמצוא דרכים להתקדם שלאו דווקא תלויות בהגדלת עוצמת החישוב הזמינה.  למרות הפיקוח (ואולי בגללו) ארצות הברית לא הצליחה למנוע מסין מלהראות שיש ביכולתה להגיע איתה לאיזון אסטרטגי בתחום הבינה המלאכותית באמצעות טכנולוגיה ושיטות שאינן כפופות למשטר הפיקוח.  עם זאת, הנתונים שהראינו מלמדים שסין לא פרצה דרך מדעית חדשה שמשנה את יסודות המחשוב, אלא שהצליחה לסגור את הפער בשילוב בין שיטות יצירתיות שאפשרו לה להתקדם ביחד עם קו המגמה והביצועים הצפויים בתחום. עדות נוספת לכך שהבעיה אינה נובעת מכשל טכני של הגבלות היצוא היא  כי חברת DeepSeek עצמה חשפה את מגבלותיה להמשיך להתקדם ללא חומרה מתאימה - כזו שאין באפשרותה להשיג כיום בגלל ההגבלות. במצב הנוכחי, במערב יש סדר גודל כזה של מעבדים מתקדמים (שאין בסין, ככל הנראה) שכבר בשבועיים שעברו מאז יציאת DeepSeek  לשוק, הצליחה חברת Open AI  (המפתחת את Chat GPT)  לפרסם מודל הסקה חדש, o3-mini – אשר מנצח את DeepSeek R1 בכלל המדדים וזאת רק בזכות נגישות עדיפה למעבדים מתקדמים. אפשר לצפות שבעתיד המודלים המערביים יצליחו להציג  ביצועים טובים אף יותר באמצעות הטמעת השיטות בהן השתמשה DeepSeek. לכן, כל עוד סין נאלצת ומצליחה לפתח שיטות חדשות כדי להתמודד עם היעדר משאבי מחשוב מחד גיסא, וארצות הברית מנצלת את השיטות הללו ביחד עם עוצמת המחשוב העדיפה שלה מאידך גיסא,   נראה כי שתי המעצמות ימצאו בנקודת איזון אסטרטגית.

בצד האמריקאי, הדבר מחייב התבוננות מחודשת על משטר הפיקוח.  אמנם סין לא תוכל, ככל הנראה, להגיע להובלה בלי גישה לחומרה האמריקאית, אבל היא הצליחה לנתק את הקשר בין סנקציות למצב בו היא מצליחה מבחינת מחקר ופיתוח לשמור על קו המגמה המקובל בעולם גם במגבלות החומרה החלות עליה. מצד אחד, זאת תוצאה לא רעה ותואמת את ההגבלות אשר נועדו, לפחות ברמה המוצהרת, למנוע מסין לעקוף את ארצות הברית. אך באותה מידה  ניתן לומר כי משטר ההגבלות ההולך ומחריף בעצם אילץ את סין למצוא אלטרנטיבה ולבסס את עצמאותה הטכנולוגית, אפילו אם לא תהיה לה יכולת להשיג הובלה.  מבחינה זו, ייתכן וניתן לראות בDeepSeek סנונית ראשונה לאוטרקיה סינית טכנולוגית, שאיפה אשר סין הכריזה עליה כבר לפני שנים. דוגמאות לאוטרקיה המתהווה היא שחברת DeepSeek מעסיקה רק סינים שלמדו באוניברסיטאות סיניות והיא גם ובוחנת שימוש במעבדי Huawei סינים להפעלת המודלים שלה.  לסיכום, ברמה הטכנולוגית, כנראה שסין לא תוכל לעקוף את ארצות הברית, אבל ארצות הברית לא תוכל למנוע את שמירת השוויון על ידי סין באמצעות הגבלות יצוא.

אלו אפשרויות עומדות בפני ארצות הברית להתמודד עם המצב החדש? ניתן אולי לדמות את המצב היום לזה שארצות הברית היתה בו בשנים שקדמו לפיתוח פצצת האטום.  כשהבינה את הפוטנציאל היישומי של הפיזיקה הגרעינית, המדע הפך מתחום אקדמי פתוח לתחום מסווג וכל המחקר האמריקאי נכנס תחת תוכנית מנהטן.[13] זה אפשר לארצות הברית לשלוט בתפוצת הידע לפרק זמן מוגבל וקריטי. כיום, מדע הבינה המלאכותית נמצא בנקודה דומה. לכן, יתכן והכלי המשמעותי ביותר העומד לרשות ארצות הברית יהיה הגבלת פרסום מחקרים מדעיים בסיסיים על ידי הכנסת כל תחום הבינה המלאכותית תחת תכנית סטארגייט שהנשיא טראמפ הכריז עליה ביומו הראשון בתפקיד. וזו תהיה, בעצם, תכנית מנהטן של הבינה המלאכותית. כך או אחרת, שתי המעצמות – והעולם כולו, למעשה – יצטרכו ללמוד לחיות ולהתמודד עם מצב חדש של איזון אסטרטגי בין סין וארצות הברית ולשקלל זאת לתוך חישוביהן האסטרטגיים.

בממד המשמעויות עבור ישראל, עולות מספר מסקנות עקרוניות. החשובה שביניהן היא, שלמרות הפיתוי לראות בDeepSeek- פתרון קסם, אסור שישראל תסתנוור ותחשוב שיש בנמצא קיצור דרך טכנולוגי שייתר את הצורך בעוצמת חישוב על מנת לקיים תכנית בינה מלאכותית מובילה ובת-קיימא. כפי שהראינו, DeepSeek עשתה שימוש, לכל הפחות, בעוצמת חישוב שהיא גדולה בעשרות אחוזים מאשר זו שישראל תוכל לספק באמצעות מחשב העל שיוקם במסגרת התכנית הלאומית הקיימת. וזאת, מבלי להתחשב בדרישות החישוב שמכפילות עצמן בערך כל שישה חודשים  וגורמות לכל מחשב להתיישן במהירות ולאבד את הרלוונטיות שלו בלי השקעה מתמדת בשדרוגו.

במרחב שיקוליה הגיאו-פוליטיים, ישראל מוצאת את עצמה בדילמה. כיום, ישראל נמצאת בנחיתות בתחום הבינה המלאכותית והיא חייבת לפלס דרך חדשה כדי להתקדם.    משום שארצות הברית, בעלת בריתה החשובה ביותר, השיתה עליה הגבלות, עלולים להיות כאלה שיתפתו לחפש פתרונות המבוססים על טכנולוגיות סיניות, למשל שבבים של חברת Huawei, או שיתופי פעולה עם חברות סיניות בתחום על מנת לקדם את יכולותיה של ישראל. תהיה זו תוצאה עגומה ביותר וחיוני שישראל וארצות הברית תעשנה כל מאמץ למנוע ממנה להתממש.

דרך המלך עוברת בעלייתה של ישראל לדרג א' והסרת ההגבלות מעליה. ישנם שלושה מסלולים אפשריים לשם. הראשון הוא הסתמכות על מערכת היחסים בין ממשלת ישראל והנשיא טראמפ על מנת שזה יקדם את ישראל לדרג א', או לכל הפחות יחריג את ישראל מההגבלות. מסלול אפשרי נוסף הוא שיפור מעמדה של ישראל כחלק מהתמורה עבור הסדר מדיני רחב יותר במזרח התיכון. והדרך השלישית, ייתכן שהיא הסבירה ביותר, היא  להאיץ את דיאלוג ה Trusted Technologies בין המדינות, שהחל בימי ממשלת בנט  לאחר החתימה על הצהרת ירושלים על ידי הנשיא ביידן בירושלים ומתקדם בעצלתיים (בלשון המעטה)  – וליישמו בהקדם. כל אלה, במקביל להתאמת התוכניות הלאומיות לצרכים שנמנו במאמר זה, על מנת לבסס הובלה בבינה המלאכותית ולהגביר את נכסיותה של ישראל עבור ארצות הברית.

סיכום

האירועים וההתפתחויות בתחום הבינה המלאכותית בתקופה האחרונה, וביתר שאת בשבועות האחרונים, מביאים למסקנה כי אל לה לישראל להסתנוור ולהידבק בשיכרון המעמקים של .DeepSeek במקום זאת, מתגבשת ההכרה בכך שיש צורך לעדכן את התוכניות הלאומיות ולאמץ תוכנית טכנולוגיה לאומית, שתבטיח תשתית טכנולוגיה  מינימלית אשר תבצר את ריבונותה הטכנולוגית, תיצור את התנאים ההכרחיים עבור התעשייה הישראלית למצות את יכולותיה, תחזק את נכסיותה של ישראל בעיני ארצות הברית, תיצור הזדמנויות מלהיבות לשיתופי פעולה אזוריים עם מדינות המפרץ ובכללן ערב הסעודית, ותאפשר לישראל לתפוס את מקומה הראוי בשורה הראשונה של מדינות העולם ולנסוק לגבהים חדשים.

[1] Kyle Wiggers, “DeepSeek Claims Its ‘reasoning’ Model Beats OpenAI’s O1 on Certain Benchmarks,” TechCrunch (blog), January 27, 2025, https://techcrunch.com/2025/01/27/deepseek-claims-its-reasoning-model-beats-openais-o1-on-certain-benchmarks/; DeepSeek-AI et al., “DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning” (arXiv, January 22, 2025), https://doi.org/10.48550/arXiv.2501.12948.

[2] Jack Burnham and Craig Singleton, “‘AI’s Sputnik Moment’: Chinese AI Model DeepSeek-R1 Reportedly Surpasses Leading U.S. AI Models,” FDD Policy Brief, January 30, 2025, https://www.fdd.org/analysis/policy_briefs/2025/01/30/ais-sputnik-moment-chinese-ai-model-deepseek-r1-reportedly-surpasses-leading-u-s-ai-models/.

[3] אגף קו האופק, “השקת מודל DeepSeek R1 מערערת את פרדיגמת פיתוח ה-AI במערב ומאיימת לשנות את המאזן בתחרות הגאו-טכנולוגית בין ארה"ב לסין” (משרד החדשנות, המדע והטכנולוגיה, January 28, 2025).

[4] Jenia Jitsev ️‍ [@JJitsev], “DeepSeek R1 Distilled Llama 70B & Qwen 32B Models Claim to Solve Olympiad Level Math & Coding Problems, Matching O1-Mini Which Claims Same. Can They Handle Versions of AIW Problems That Reveal Generalization & Basic Reasoning Deficits in SOTA LLMs?(Https://Arxiv.Org/Abs/2406.02061) 1/n Https://T.Co/uYmdCK0y0j,” Tweet, Twitter, February 3, 2025, https://x.com/JJitsev/status/1886210118594760744.

[5] Ben Thompson, “DeepSeek FAQ,” Stratechery (blog), January 27, 2025, https://stratechery.com/2025/deepseek-faq/.

[6] Lennart Heim, “The Rise of DeepSeek: What the Headlines Miss,” January 25, 2025, https://blog.heim.xyz/deepseek-what-the-headlines-miss/; DeepSeek-AI et al., “DeepSeek-V3 Technical Report” (arXiv, December 27, 2024), https://doi.org/10.48550/arXiv.2412.19437.

[7] Jordan Schneider et al., “Deepseek: The Quiet Giant Leading China’s AI Race,” January 28, 2025, https://www.chinatalk.media/p/deepseek-ceo-interview-with-chinas.

[8] Dylan Patel et al., “DeepSeek Debates: Chinese Leadership On Cost, True Training Cost, Closed Model Margin Impacts,” SemiAnalysis (blog), January 31, 2025, https://semianalysis.com/2025/01/31/deepseek-debates/.

[9] DeepSeek-AI et al., “DeepSeek-V3 Technical Report.”

[10] ראה אתLlama Team, “The Llama 3 Herd of Models” (AI @ Meta, July 23, 2024), https://ai.meta.com/research/publications/the-llama-3-herd-of-models/. לפרטי מחשב העל והעלות החישובית. עלות דולרית ע"ס הערכת עלות שימוש במעבד H100 העומדת על 3$/שעה.

[11] Dennis Normile, “Chinese Firm’s Faster, Cheaper AI Language Model Makes a Splash,” Science 387, no. 6731 (January 15, 2025): 238, https://doi.org/10.1126/science.z18lyzw.

[12] Patel et al., “DeepSeek Debates.”

[13] Michael S. Sweeney, Secrets of Victory: The Office of Censorship and the American Press and Radio in World War II (Chapel Hill, NC: University of North Carolina Press, 2001), 196–200.

הדעות המובעות בפרסומי המכון למחקרי ביטחון לאומי הן של המחברים בלבד.
סוג הפרסום מבט על
נושאיםטכנולוגיות מתקדמות וביטחון לאומיהמרכז למדיניות ישראל-סין ע"ש דיאן וגילפורד גלייזר
English

אירועים

לכל האירועים
הכנס השנתי הבינלאומי ה-18
25 בפברואר, 2025
16:00 - 08:15
Photo: Ronen Topelberg

פרסומים נוספים בנושא

לכל הפרסומים
Wolfgang Schwan / Anadolu Agency
מהפכת רחפני FPV ומשמעויותיה בלוחמת היבשה ובממדים נוספים
מהפכת רחפני FPV משנה בצורה עמוקה את לוחמת היבשה – זה לא רק אמצעי לחימה חדש בתפוצה רחבה אלא שינוי משמעותי בטכניקות הלחימה, בהתארגנות הכוח ובאופן ניהול הקרב הטקטי (מהות התחבולה). הניסיון של אוקראינה לבצע מתקפת נגד מערכתית בקיץ 2023 באמצעות כוחותיה הצבאיים, שהתבססו על דוקטרינת נאט"ו (מבנה וארגון לקרב, אמל"ח ותו"ל), נכשל כישלון חרוץ. ספק אם הגנרלים בברית נאט"ו הבינו את עומק השינוי בשדה הקרב. הדרך להבין את מהות השינוי מתחילה בהבנת ייחודיות האמל"ח, אבל חייבת להמשיך בשינויים הנגזרים מדרך הפעולה של הכוח היבשתי המשולב – לא ניתן לנתח את הקרבות באוקראינה בעיניים המקובעות על תפיסות טרום מהפכת ה-FPV (טקטיקות של המלחמה הקרה ועידן המבצעים נגד טרור). צבאות רוסיה ואוקראינה נלחמים בשנתיים האחרונות בשדה הקרב המשתנה החדש – מה שהם כבר הספיקו לשכוח אנחנו עדיין לא למדנו. מי שייכנס לקרב במלחמה הבאה ללא הטמעת מהפכת ה-FPV יפסיד בנוקאאוט ולא בנקודות.
21/05/25
יירוט טילים בליסטיים בשלב ההאצה
יירוט טילים ורקטות בשלב המוקדם ביותר של המראתם הינה פעולה התקפית בעלת אופי הגנתי מובהק, שמטרתה מניעת נזק ממשי או אגבי במדינה המותקפת, תוך הסבת נזק מרבי לגוף התוקף. במקרה של מדינת ישראל לשיטת יירוט זו יתרון כפול ומכופל עקב שטחה הקטן, האיומים מצד איראן ושלוחיה ב"מעגל האש" הקרוב והרחוק, ופוטנציאל הנזק הרב כתוצאה מפגיעה בתשתיות אזרחיות וצבאיות. במאמר זה נסקרים האתגרים והפיתוחים הטכנולוגיים שביירוט טילים ורקטות, היבטים גיאו-פוליטיים רלוונטיים וכן לקחים למדינת ישראל.
13/02/25
אתגר הבינה המלאכותית: הידרדרות מעמדה של ישראל והצורך הדחוף באסטרטגיה לאומית חדשה
המרוץ העולמי בתחום הבינה המלאכותית ממשיך במלוא עוזו, כשהמדינות המתקדמות מזהות את הנושא כרכיב יסודי בעוצמתן הכלכלית וביטחונן הלאומי ומשקיעות תשומות לאומיות בהתאמה לגודל האתגר והשעה. למרות מאמציה, מדינת ישראל לא מצליחה לעמוד בתחרות ומיקומה הולך ויורד במדדים העולמיים. כבר היום מורגשת יכולתה המוגבלת של תעשיית הטכנולוגיה הישראלית להתחרות בתחום, מגמה שתלך ותחמיר ללא התערבות מיידית, הגדרת אסטרטגיה עדכנית, קביעת יעדי תשתית המחשוב הלאומיים ואימוץ תכנית טכנולוגיה לאומית.
15/01/25

הישארו מעודכנים

ההרשמה התקבלה בהצלחה! תודה.
  • מחקר

    • נושאים
      • ישראל בזירה הגלובלית
      • יחסי ישראל-ארה"ב
      • מרכז גלייזר למדיניות ישראל-סין
      • רוסיה
      • אירופה
      • איראן והציר השיעי
      • איראן
      • לבנון וחזבאללה
      • סוריה
      • תימן והחות'ים
      • עיראק והמיליציות השיעיות העיראקיות
      • מסכסוך להסדרים
      • יחסי ישראל-פלסטינים
      • רצועת עזה וחמאס
      • הסכמי שלום ונורמליזציה במזרח התיכון
      • סעודיה ומדינות המפרץ
      • טורקיה
      • מצרים
      • ירדן
      • מדיניות הביטחון הלאומי של ישראל
      • צבא ואסטרטגיה
      • חוסן חברתי והחברה הישראלית
      • יחסי יהודים-ערבים בישראל
      • אקלים, תשתיות ואנרגיה
      • טרור ולוחמה בעצימות נמוכה
      • המחקר העל-זירתי
      • המרכז לאיסוף וניתוח נתונים
      • משפט וביטחון לאומי
      • טכנולוגיות מתקדמות וביטחון לאומי
      • תודעה והשפעה זרה
      • כלכלה וביטחון לאומי
    • פרויקטים
      • מניעת הגלישה למציאות של מדינה אחת
      • אנטישמיות בת-זמננו בארצות הברית
      • תפיסות ביחס ליהודים ולישראל במרחב הערבי-מוסלמי והשפעותיהן על המערב
  • פרסומים

    • כל הפרסומים
    • מבט על
    • ניירות מדיניות
    • פרסום מיוחד
    • עדכן אסטרטגי
    • במה טכנולוגית
    • מזכרים
    • נתונים
    • פוסטים
    • ספרים
    • ארכיון
  • אודות

    • חזון וייעוד
    • קורות המכון
    • המחקר
    • הדירקטוריון
    • הדרכה ולמידה
    • התמחות במכון
    • מלגות ופרסים
    • דיווח לרשות התאגידים
  • מדיה

    • כתבות תקשורת
    • רדיו וטלויזיה
    • מאמרים
    • ראיונות
    • וידאו
    • פודקאסטרטגי
    • הודעות לעיתונות
  • דף הבית

  • אירועים

  • נתונים

  • צוות

  • צור קשר

  • ניוזלטר

  • English

לוגו INSS המכון למחקרי ביטחון לאומי, מחקר אסטרטגי, חדשני ומכוון מדיניות- מעבר לדף הבית
רחוב חיים לבנון 40 תל אביב 6997556 | טל 03-640-0400 | פקס 03-774-7590 | דוא"ל לפניות הציבור info@inss.org.il
פותח על ידי דעת מקבוצת רילקומרס.
This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.