OpenClaw + NemoClaw: כשה-AI Agent הפך ממשחק לתשתית

OpenClaw + NemoClaw: כשה-AI Agent הפך ממשחק לתשתית

מה זה אומר לעסקים קטנים ולמה NVIDIA שינו את כללי המשחק

שאלה אחת לפני שאתם קוראים

מה ההבדל בין ה-AI שאתם מכירים לבין ה-AI שחלמתם עליו?

זוכרים את הפעם הראשונה שהכרתם את ChatGPT? אחרי ההתלהבות הראשונית, ביקשתם ממנו לעדכן אתכם על משהו בעוד שעה. הוא אמר סבבה. ולא קרה כלום. זה לא כישלון של בינה. זה כישלון של ארכיטקטורה. ChatGPT לא מדבר עם השעון של הטלפון, לא מחובר ליומן, לא יודע מה קורה בחוץ. הוא חי בתוך חלון שיחה ולא מעבר לו. אתם מדברים אתו, הוא עונה. זהו.

רצינו את זה, אז החלטנו להמצאי סוכנים.

רגע: מה זה בכלל סוכן AI?

המילה Agent נזרקת היום לכל כיוון. כל כלי שמרגיש קצת יותר חכם ממחשבון מקבל את התווית הזאת. אז בואו נהיה מדויקים.

ההגדרה הפשוטה

סוכן AI הוא מערכת שמסוגלת לקבל יעד, לתכנן כיצד להגיע אליו, לבצע פעולות בעולם האמיתי ולהתאים את עצמה לפי מה שקורה בדרך. לא מחכה שתשאל אותה. לא עונה ושוכחת. פועלת.

ארבעה רכיבים שמגדירים סוכן אמיתי:
הוא מחובר לכלים חיצוניים (מייל, יומן, API, דפדפן),
יש לו זיכרון שמאפשר לו לזכור מה קרה,
הוא מסוגל לתכנן סדר פעולות ולא רק לענות,
והוא מגיב לשינויים בסביבה ולא רק לפקודות.
תחשבו על זה ככה, כאשר ביקשתם מהצ'אט שיזכיר לכם משהו בעוד שעה, הוא שלח פקודה לעשות את זה אבל לא היה יומן או שעון שיקבל את זה ו/או משהו שיגיד לו שחלפה שעה בכדי להזכיר אתכם. הוא צ'אט, כתבם, הוא הגיב ונגמר העניין.

לא כל מה שקוראים לו סוכן הוא סוכן

וכאן מגיע ה-BS detector שצריך לפתח.

כלי מה הוא באמת
ChatGPT / Claude (ממשק רגיל) מודל שיחה: עונה לשאלות, אין זיכרון בין שיחות, אין כלים, לאחרונה חלקם התחילו להוסיף כלים, אתה יכול בצ'אט GPI לעשות @משהו, ולהעלות כלים חיצוניים כמו canva, גם קלוד יצר מחסן כלים דיי מרשים שניתן לשלב היום בצ'אט אבל בסופו של דבר צ'אט הוא משימתי. פנית, הוא ייצר ו/או נתן לך תשובה ושם זה נגמר.
GPTs של OpenAI מודל עם הוראות מותאמות. יכול להשתמש בכלים מוגדרים מראש, אבל לא אוטונומי, הוא הוגדר עם כלים מוגדרים כמו מקודם, יכול להיות שאפילו הוסיפו לו מחסן נתונים קטן והוא סוג של RAG קטן עם מידע ספציפי, יש לו פרומפט של הגדרה ודרכי פעולה ומדריכים לכלים שהוא אמור להשתמש בהם אבל גם הוא, בסופו של דבר, צ'אט. הוא מגיב לפקודה
Gems של Google כמעט אותו דבר: Gemini עם system prompt מותאם, לא סוכן בפועל, יש שיומרו פחות אפילו מה GPTS ההבדל הוא שהוא יודע ממש טוב להתחפש לסוכן, לתת את התחושה אבל בלי באמת להיות, וגם הוא בסופו של דבר צ'אט. אומרים לו משהו והוא מגיב, נגמר אז נגמר, חוזר לישון
Cursor / Windsurf סוכן קוד: כן, פועל באמת. קורא קבצים, מריץ קוד, מתקן בעיות. זה סוכן אמיתי בתחום מוגדר, אבל הוא רספונסיבי למשימה. אם אני אומר לסוכן קוד לכתוב אפליקציה כל שהיא, הוא ירוץ, הוא יכתוב, הוא יבדוק, הוא יקבל פידבקים ויגיב אליהם, הוא יקרא, הוא יעשה אבל ברגע שהמשימה נגמרה, הוא חוזר לישון בדיוק כמו קודמיו. אם רוצים שהוא יתעורר צריך להוסיף כלי של שעון שיפעיל טריגר עם משימה, הוא לא "עושה את זה לבד". אז כן, הטריגר הוא חידוש, הוא עכשיו יכול להגיב למייל שנכנס או לשעה שהגיעה, הוא יכול להגיב לחיישן או משהו שקרה אבל גם כאן, הטריגר בסך הכל מדמה שאלה בצ'אט. הטריגר הופעל הפעולה התרחשה והוא חזר לישון.
OpenClaw סוכן כללי: פועל, מתכנן, מריץ קוד, מחובר לעולם. ללא הגבלות תחום, כאן יש עוד משהו קטן שאין בקודמים. תאורטית, אין הבדל בינו לבין כל סוכן רגיל, הוא מופעל מטריגרים, העניין הוא בארכיטקטורה, הוא יכול ליצור לעצמו טריגרים חדשים, לשנות אותם, לאפיין אותם, לשנות אותם וכו' ועוד הבדל קטן. כל מי שאי פעם כתב קוד בחיים שלו כתב לולאות, זה הבסיס של תוכנה בהתנהלות תנאים ובסופו של דבר מדובר במשהו דטרמיניסטי, אם קרה משהו אז ככה פועלים, אם רצ משהו כמות פעמים אז בסוף קרה משהו אחר. תנאים ולולאות הם כלים דטרמיניסטיים, סופיים בעלי אפשרות אחת לתוצאה, openClaw העביר את הפעולות האלו לתוך הלוגיקה של ה AI. הוא כבר יודע להחליט על הגיון ולא על תנאי.

ההבדל המהותי: GPT ו-Gem מחכים לפקודה ועונים. Cursor ו-OpenClaw מקבלים יעד ומתחילים לעבוד.

אז מה זה agentic ולמה כולם מתלהבים?

כשאנחנו מדברים על מערכות agentic אנחנו מדברים על שינוי פרדיגמה. לא chatbot שמשפר תהליכים. מערכת שמחליפה תהליכים. כי הסוכן אפשר לנו להגיד למערכת, כאשר מגיעה פגישה חדשה תכניס אותה ליומן ותזכיר לי עליה שעתיים לפני. זה היה האג'נטיק של שלשום. התלהבות העולם מגיעה מנקודה אחת: לראשונה אפשר לתת למחשב יעד עסקי ולא רשימת הוראות. ‘הגדל את שביעות רצון הלקוחות’ ולא ‘שלח מייל כשמגיעה פנייה’. המעבר הזה הוא ענק. עכשיו אפשר להגיד לו גם, תבדוק לי את הפגישה, אם היא בוטלה תראה אם אתה יכול לקבוע לי מישהו אחר במקום אבל אם לא הצלחת אז תזיז את האחרונה לשעה הזאת ותקצר לי את היום ותשלח גם הודעה לאשתי שאני מגיע מוקדם הביתה היום.

אבל כאן בדיוק נמצאת גם הבעיה.

· · ·

הבעיה: כוח ללא כלוב

כשסוכן כללי פועל באמת בעולם, כשהוא שולח מיילים, מתאם פגישות, כותב קוד ומעלה אותו, עושה פעולות ב-API, ממלא טפסים, כל פעולה כזאת היא פעולה בלתי הפיכה. הוא לא יכול ‘בטל שליחה’ על מייל שיצא. לא יכול לחזור אחורה מ-API call שנשלח. לא יכול לשחזר קובץ שנמחק. תוסיפו לזה שאנו לא חיים בעולם מושלם, יש אנשים לא נחמדים שם בחוץ שהיו רוצים להשיג שליטה באפליצקיה של הבנק שלך, ביומן שלך ואת הטלפונים של הלקוחות שלך. הם גם יודעים להשאיר ל AI פירורי לחם של הוראות שנקראות הזרקות פרומפטים שנועדו רק בשביל להתערב בהגיון שלו.

זו לא בעיה תיאורטית. זה הדבר שהפיל חברות שניסו לייצר agentic systems לפני שהיו כלים מתאימים.

אז איפה היו הבעיות שלנו בסוכנים כללים ובסוכנים רגילים, נתחיל בסוכנים שאנו מכירים, התגובתיים.

למה AI תגובתי לא מספיק ואיך אפשר לסמוך על agents ללא מסגרת
1. תגובתיות לעומת יוזמה: רוב מערכות ה-AI מגיבות. הן ממתינות לשאלה. עסק לא עובד ככה. עסק זקוק למערכת שיודעת לזהות בעצמה שמשהו צריך לקרות.
2. חוסר בקרה: agent שפועל בחופשיות על שרת יכול לעשות נזק. לא מרוע, מהעדר הגנות. גישה לכל קבצים, חיבורי רשת פתוחים, יכולת להריץ כל פקודה.
3. חוסר שקיפות: מה עשה ה-agent? מה שלח? לאיפה התחבר? בלי audit log מסודר אי אפשר לבקר, לדעת מה קרה או למה.

הנה דוגמה שמסבירה את זה

חשבו על GPT שמחובר ליומן שלכם. הוא רואה שיש פגישה מחר בבוקר. הלקוח ביטל. ה-GPT ‘יודע’ שצריך לארגן מחדש. אבל הוא לא עושה כלום כי לא שאלתם אותו. הוא קיבל משימה (טריגר במייל) ביטל את הפגישה וחזר לישון. סוכן אמיתי היה מזהה את הביטול, מציע מועדים חלופיים ללקוח, מעדכן את היומן לאחר אישור, ושולח לכם סיכום. ללא שתגידו לו שמה.

הפער בין שניהם הוא לא טכנולוגי. הוא ארכיטקטורי. ואת הפער הזה OpenClaw בא לסגור, ו-NemoClaw בא לעשות אותו בטוח. הבעיה שהוא יצר, שניה אנו נגיע אליה, אבל נתחיל עם זה שהוא כבר ידע לפתור את הבעיה הזאת, הוא ידע לחשוב ולקבל החלטה וגם לפעול על פניה, אבל כפי שאמרתי, הפתרון הוא הבעיה של עצמו, ותכף נגיע לזה.

· · ·

מה אם הפנטזיה אפשרית?

מה אם הייתי אומר לכם שיש כלי שמסוגל להגשים את מה שסיפרו לכם ולא את מה שנתנו לכם? תנו לי לצייר יום בחיי בעל עסק שמשתמש במערכת כזאת.

יום רגיל עם agent כללי שעובד

החלטתם לפרסם קמפיין לעסק שלכם בפייסבוק. ה-agent עוקב אחרי הקמפיין: עלויות, מחיר מילות מפתח, חשיפה, המרות. הוא מזהה שמילת מפתח אחת גוזלת 40% מהתקציב עם המרה נמוכה. הוא משנה את ההקצאה לבד. אם הוא לא בטוח, הוא שולח לכם הודעה בוואטסאפ: ‘שמתי לב ל-X, אני חושב שכדאי לעשות Y. אתם מאשרים?’

במקביל הוא ממיין לכם את המיילים. לא סתם מסמן אותם. הוא קורא את כל מייל, מזהה מה נדרש ממכם, ושולח בשמכם תגובה בשפה שלכם. פורוורד שהגיע שמבקש לעדכן פרטי משלוח, הוא מטפל בו ישירות.

הוא מזכיר לכם שיש יום הולדת לאחותכם בעוד שבוע ושואל מה תקציב המתנה ומה הכיוון. נתתם לו תקציב של 300 שקל. הוא חזר עם רשימה של רעיונות עם מחירים מעסקים באזור שלכם, כולל מי עושה משלוחים.

לקוח שיש לו תור מחר בשעה 16:00 שלח הודעה שהוא מבטל. המערכת קבעה אתו מחדש לשבוע הבא ביום רביעי ב-14:00 כי היה פנוי ביומן. במקביל הציעה את המקום הפנוי שנפתח מחר לאחד הלקוחות שביקשו להקדים, והוא קיבל SMS. שאר הלקוחות של מחר קיבלו תזכורת. אחד מהם ביקש להיכנס לחניון שלכם, אז המערכת שלחה הודעה למנהל החניון עם מספר הרכב.

בפקק בדרך הביתה נזכרתם שמעצבנת אתכם הדרך שבה הזמנות מהאתר עוברות למחסן. יש לכם רעיון יותר טוב אבל אתם לא מתכנתים. ביקשתם מה-agent שיכתוב סקריפט קצר שעושה את זה, שיריץ בדיקות בסביבת פיתוח, ולאחר שתאשרו את התוצאות יעלה אותו למערכת.

אני יכול להמשיך אבל אתם מתחילים להבין: כאשר אני מדבר על הפנטזיה, היא אפשרית. יש לזה עוד דברים שצריך להבין, אבל ברמת הפנטזיה הזאת: הכלי קיים.

אז מה זה בעצם OpenClaw

OpenClaw נולד בשקט. לא היה לו מסע שיווקי, לא VCs, לא כנס השקה. הוא עלה ל-GitHub ואנשים טכניים התחילו לשים לב. הרעיון הבסיסי שלו שונה ממה שרוב האנשים מכירים בתור ‘AI chatbot’. הוא לא חיכה לשאלות. הוא פעל. ברגע שהגדרת לו יעד, הוא כתב קוד, הריץ אותו, בדק תוצאות, תיקן בעיות וחזר על הלולאה, הכל בלי שמישהו צריך לאשר כל צעד.

בשפה ארכיטקטורית: OpenClaw מימש מה שאני קורא לו ‘execution topology’, לא מנוע שיחה אלא מנוע ביצוע. ההבדל לא סמנטי. הוא ארכיטקטורי.

אם chatbot הוא שף שמסביר לך איך לבשל, OpenClaw הוא השף שנמצא במטבח ובישל.

אז מה הייתה הבעיה?

הכוח הגדול של OpenClaw היה גם הבעיה הגדולה שלו: הוא היה ללא כלוב. Agent שפועל אוטונומית על המכונה שלך, עם גישה מלאה לקבצים, לרשת, לתהליכים: זה מצוין אם אתה מפתח שיודע מה הוא עושה. זה בעייתי מאוד אם אתה עסק שרוצה להריץ את זה ב-production. זה כמו להגיד שיש לך בבית את העובדת הכי טובה בעולם, מנקה, מבשלת, מסדרת וגם עושה מסאז'ים, אבל כל אחד שיודע תאילנדית יכול להגיד לה מה לעשות, כולל אנשים מהרחוב. הסיבה, הפרויקט הזה גדל כל כך מהר שכולם חשבו על איך להוסיף לו יכולות נוספות ויש לו היום אין סוף של כאלו, אבל אף אחד לא חשב איך להפוך אותו למוצר עסקי מוגן. המשמעות, רק מי שבאמת ידע איך לעבוד איתו ולהגדיר אותו ולעדכן אותו יכל היה באמת להנות ממנו וגם זה עד הדרגהה של השכן שאולי יודע יותר.

ה-agent היה פועל חופשי בבית שלך בלי ש-door lock קיים. לא מתוך כוונה רעה, פשוט כי אף אחד לא שיפץ את הבית להיות production-ready.

הבעיות שמנעו אימוץ ב-production
גישה חופשית לכל הקבצים: agent שעשה טעות יכול לעשות נזק אמיתי
חיבורי רשת פתוחים: אין שליטה על מה שנשלח לאן ולמי
אין isolation: תהליך אחד יכול לפגוע בתהליכים אחרים
אין audit log: קשה לדעת מה עשה ה-agent בדיוק, מתי ולמה
אין policy: ה-agent יכול לבצע כל פעולה שעלתה בראשו
לא מתאים לסביבות ארגוניות: compliance, SOC2, HIPAA — שכחו

כך OpenClaw נשאר כלי של ‘מי שמבין’: עוצמתי, מבריק, ולא מוכן לעולם האמיתי.

· · ·

NVIDIA נכנסת לתמונה: NemoClaw

מישהו גדול שם לב. NVIDIA, החברה שהפכה מיצרנית גרפיקה לשולטת בתשתית AI העולמית, ראתה את OpenClaw ואמרה: ‘האדריכלות נכונה. הכלוב חסר. נבנה את הכלוב.’ הם גייסו את מי שפיתח את OpenClaw ואת הצוותים העצומים שלהם ויצאו לדרך ואתמול הם שחררו את זה לעולם.

חשוב מאוד להבין NemoClaw הוא לא גרסה חדשה של OpenClaw. הוא שכבת אבטחה ותשתית שמעטפת את OpenClaw ומאפשרת להריץ אותו בסביבות production אמיתיות.

איך NemoClaw מאבטח את ה-Agent
Network Layer: כל חיבור יוצא חסום כברירת מחדל. רק מה שהגדרת ב-policy מותר.
Filesystem Isolation: ה-agent כלוא ב-/sandbox ו-/tmp בלבד. לא מגיע לשום דבר אחר.
Process Security: מניעת privilege escalation וסריקת syscalls מסוכנים (seccomp + Landlock).
Inference Gateway: כל קריאה למודל עוברת דרך NVIDIA OpenShell, לא ישירות מה-agent.

Nemotron: המודל החינמי שהפתיע

ביחד עם NemoClaw, NVIDIA מספקים גישה ל-Nemotron, המודל הגדול שלהם, דרך NVIDIA NIM.

מה NVIDIA נותנים ומה העלות האמיתית
Nemotron: מודל LLM חזק לשימוש דרך NVIDIA NIM
NemoClaw blueprint: קוד פתוח, ללא תשלום
OpenShell runtime: תשתית inference מקומית
הצד השני: אתה מריץ על NVIDIA GPU. זה המנוע העסקי שלהם.
Nemotron חינמי עד לגבול. production load הוא כבר עלויות API.
כמו שאני אומר בהרצאות: ‘חינם הוא מחיר, לא ערך.’ NVIDIA נותנים את ה-blueprint בחינם כי הם מוכרים את ה-GPU. אבל עד רמה מסוימת, לעסק קטן, זה באמת חינם ברמה שמספיקה ל-beta ולמחקר.
· · ·

ממשחק למוצר: מה זה אומר לעסקים

בואו נפסיק לדבר על ארכיטקטורה ונדבר על דוגמאות אמיתיות. כי זה המקום שבו ההבדל בין ‘מגניב’ ל‘חסכנו כסף’ מתבהר.

1. ניהול תורים במרפאת שיניים

מרפאת שיניים עם שלושה רופאים, 200 מטופלים פעילים ומזכירה אחת. Agent שפועל 24/7:

Agent במרפאה
מטופל שלח WhatsApp בשעה 23:00: ‘אפשר לבטל מחר ולקבוע בסוף השבוע?’ ה-agent בודק זמינות, מציע שלושה מועדים, מקבל אישור, מעדכן יומן.
48 שעות לפני תור: תזכורת אוטומטית עם אפשרות אישור או ביטול בלחיצה.
מטופל לא הגיע? ה-agent פותח slot ברשימת ממתינים ומציע אותו.
בסוף שבוע: דוח אוטומטי על אחוז ביטולים, עומס לפי ימים, לקוחות שלא הגיעו.

מה זה שווה? מזכירה בישראל עולה 6,000 עד 8,000 שקל בחודש. ה-agent פועל ב-24 דולר בחודש.

2. ניהול לידים של מכירות

חברת אינטגרציה קטנה, חמישה עובדים. כל ליד שמגיע מהאתר עובר תהליך ידני: מייל ראשוני, שאלון, תיאום שיחה, הצעת מחיר.

Pipeline ניהול לידים אוטומטי
ליד חדש נכנס מהאתר: agent שולח מייל ראשוני מותאם אישית תוך שלוש דקות.
מזהה סוג העסק מהפרטים: מתאים שאלות ממוקדות לתחום.
ליד ענה לשאלות: agent מציע שלושה זמני שיחה ומתאם עם יומן ה-CRM.
ליד לא ענה 48 שעות: followup אוטומטי. 72 שעות נוספות: סיכום לנציג.
Weekly digest: כמה לידים נכנסו, כמה המירו, איפה הצינור נסתם.

בלי agent כזה, נציג מכירות מבזבז 30 עד 40 אחוז מזמנו על administrative work. עם agent, הוא מגיע לשיחות עם אנשים שכבר עברו qualification.

3. ניהול מערכת משלוחים

חנות e-commerce קטנה, 50 עד 100 הזמנות ביום.

Agent משלוחים
הזמנה חדשה: agent מאמת כתובת, מייצר שובר משלוח, מעדכן לקוח.
חבילה יצאה: SMS אוטומטי עם מספר מעקב ולינק.
חבילה מתעכבת: agent מזהה, מעדכן לקוח, פותח case עם חברת המשלוח.
חבילה לא נמסרה: agent מתאם מסירה חוזרת ישירות מול הלקוח.
יום אחרי קבלה: בקשת ביקורת אוטומטית עם לינק ל-Google Reviews.

מה זה מחסל? פניות של ‘איפה ההזמנה שלי?’ הן 70 אחוז מפניות שירות לקוחות בחנויות online. כולן אוטומטיות.

4. בעל חנות פיזית: ניהול מלאי ושביעות רצון לקוחות

חנות ספרים, ביגוד, כלי בית, לא משנה. ה-agent מחובר לקופה, ליומן ולמייל.

Agent לחנות פיזית
מוצר ירד מתחת לרמת מלאי מינימלית: agent שולח בקשת הזמנה לספק ומציין כמות.
לקוח רשום שלא ביקר 60 יום: agent שולח הודעה עם הצעה אישית מותאמת להיסטוריית הרכישות שלו.
נגמר מוצר שלקוח שאל עליו? agent מחבר ביניהם: ‘המוצר שביקשת הגיע.’
בסוף חודש: דוח אוטומטי על מוצרים שנמכרו הכי הרבה, ימי שיא, שעות עמוסות.
ביקורת שלילית ב-Google: agent מזהה, מכין טיוטת תגובה, שולח לאישורכם לפני פרסום.

5. שיווק ומדיה דיגיטלית

עסק שמנהל קמפיינים: Facebook Ads, Google Ads, Instagram, ניוזלטר.

Agent שיווק דיגיטלי
מעקב אוטומטי אחרי ביצועי קמפיינים: CTR, CPC, ROAS, בכל הפלטפורמות.
מזהה שמודעה מסוימת ‘נשחקת’: מציין זאת ומציע גרסאות חדשות לאישורכם.
עוקב אחרי trends רלוונטיים לתחום ומציע תוכן שאפשר לפרסם.
ניוזלטר חודשי: agent אוסף את הנתונים, כותב טיוטה, שולח לאישורכם.
A/B test אוטומטי: מריץ שתי גרסאות של כותרת, מודד, ממליץ על המנצחת.

6. כתיבת קוד: הדוגמה שמפתיעה

כאן חלקכם יעצרו ויגידו: מה?

כן, OpenClaw כותב קוד. לא מציע קוד. כותב, מריץ, בודק, מתקן. זה לא ChatGPT שמציע snippet. זה agent שמקבל מטרה ומוציא תוצאה.

דוגמה מהחיים: ‘צור לי script שמושך כל יום את נתוני המכירות מה-CRM, מחשב השוואה לשבוע הקודם, ושולח סיכום ב-WhatsApp למנהל.’ עם OpenClaw, זו משימה של agent, לא של developer.

עבור עסק קטן שאין לו מפתח: זה שינוי תקופה. ההבדל בין ‘אני צריך לשלם מישהו’ ל‘אני יכול להגדיר מה אני רוצה.’
· · ·

לפני ואחרי: מה באמת השתנה

לפני: עולם ה-AI Chatbot אחרי: עולם ה-AI Agent
AI עונה לשאלות AI מבצע משימות
תמיד צריך אנושי שמפעיל מקבל יעד ועובד באופן עצמאי
כלי שעוזר לאנשים לעשות עבודה מערכת שעושה עבודה בעצמה
רץ רק כשפונים אליו פועל ברקע 24/7
אין זיכרון בין שיחות זוכר הקשר, מצב ולקוחות
לא מחובר לעולם החיצוני מחובר ל-API, מייל, יומן, WhatsApp
ללא אבטחה: מסוכן ל-production עם NemoClaw: production-safe

זה לא שיפור. זו קטגוריה שונה לגמרי. כמו ההבדל בין מחשבון לבין Excel. שניהם עושים חשבון, אבל רק אחד מהם שינה את הדרך שבה אנשים עובדים.

· · ·

סיפור אמיתי: הבנייה ב-AWS Lightsail

אז הנה מה שעשיתי. בניתי את זה. לא בסימולציה, לא ב-playground. על instance אמיתי, עם IP אמיתי, עם תעבורת רשת אמיתית.

למה ככה?

כי אני חי וחושב production. זה לא עניין של גאווה מקצועית, זה עניין של עקרון שאני לא מוכן לוותר עליו. זה לא תמיד יעיל כאשר רוצים רק לבדוק איך משהו עובד, אבל עבורי, לבדוק משהו זה לבדוק אותו בתנאים הקשים ביותר, לדעת שאם אני בא להתקין את זה אצל לקוח או ללמד מישהו לעשות את זה, זה לא תאורטי, עשיתי, בדקתי, נכשלתי, תיקנתי, נכשלת, תיקנתי, בדקתי ובסוף אני באמת יודע לעשות את זה

לא משנה אם אני אבוא אליך לעסק להקים את המערכת או שאני אלמד אותך בקורס איך לעשות את זה: אני חושב יציב, אמין, מוגן, חזק. הדבר האחרון שאתה רוצה הוא שביום הכי עמוס בשנה המערכת שלך קורסת. דמיין לך קופה שקורסת בבלק פריידי, כל שקל שחסכת במערכת היום עולה לך 1000 שקלים לשעה. תחשוב תמיד פרודקשן. זה הכלל.

ולכן גם כשאני בוחר שרת לדמו, לבדיקה, לפרויקט שיחיה שלושה ימים: אני בוחר כאילו הוא ייחיה שנתיים.

למה ב AWS ולא באיזה הוסטינג עלום שם וזול

באותה מידה יכולתי לבחור לעשות את זה על שרתים של גוגל, או מייקרוסופט או כל שחקן רציני אחר, הסיבה לזה היא כמו שאמרתי, שיהיה לי אבא ואמא. פרוקדשן זה מיינדסט. זה צורה שבה המוח עובד. אני תמיד צוחק ואומר שפרודקשן זה ה OCD של ארכיטקט תוכנה. אז כן, אם אתה בונה סוכן לעסק שלך שאמור לנהל לך את החיים ואת העסק, אל תהיה קמצן, תקח את הכלים הכי טובים שיש. אני אוהב להקביל את זה ל vibe coding. כולם היום עושים vibe אין יותר מתכנת אחד שלא משתמש ב AI לייצר לעצמו קוד. זה לא קיים בעולם יותר, אבל vibe coding הוא לפי vibe או תחושה, מתכנתים רצינים פשוט כותבים קוד עם AI. אבל הארכיטקטורה אמיתית. אז אותו הדבר, גם במוצרים, סניור אמיתי, ארכיטקט אמיתי מבין שהתשתיות שאתה עובד עליהם הם הכי חשובות. אתה לא בונה גורד שחקים על פח גלי. אתה בונה יסודות

למה AWS Lightsail ולא EC2?

Lightsail הוא VPS של Amazon: פשוט, ידוע מחיר מראש, ללא הפתעות. בניגוד ל-EC2 שבו אתה יכול לקבל חשבון מפתיע בסוף החודש, Lightsail הוא flat rate. אתה יודע מה אתה משלם.

הבחירה בפועל: למה $24 בחודש
2 vCPU, 4GB RAM, 80GB SSD
2TB bandwidth חודשי
Static IP כלול במחיר
$24 קבועים בחודש ללא הפתעות
ניסיתי ב-$10 וב-$18: לא מספיק RAM ל-NemoClaw + Nemotron
$24 הנקודה שבה הכל עובד בנוחות

המדריך הקצר: איך להתקין

חשוב: זה לא מדריך copy-paste. זה מבנה של מה צריך לעשות. הפרטים משתנים עם גרסאות. תמיד בדקו את ה-README האחרון ב-GitHub.

שלב 1: הכנת ה-Instance

  • צרו Lightsail instance עם Ubuntu 24.04 LTS
  • בחרו $24/month plan: אל תנסו להסתדר עם פחות
  • צרו Static IP וחברו אותו ל-instance
  • פתחו ports: 22 (SSH), 80, 443, ו-8080 (dashboard)
  • בצעו hardening בסיסי: UFW, fail2ban, disable root login

שלב 2: התקנת NemoClaw

  • עדכנו packages: sudo apt update && sudo apt upgrade
  • התקינו Docker ו-Docker Compose
  • Clone את repository של NemoClaw מ-GitHub
  • הגדירו את קובץ ה-config עם policy הרשת: מה מותר ומה אסור
  • הגדירו API key ל-Nemotron דרך NVIDIA NIM

שלב 3: הגדרת Agent וחיבורים חיצוניים

  • הגדירו את יעדי ה-agent: מה הוא אמור לעשות
  • חברו לשירותים חיצוניים: Gmail API, WhatsApp Business API, Calendar API
  • הגדירו egress policy: רק domains מאושרים
  • בדקו sandbox isolation לפני שמריצים

שלב 4: Production ו-Monitoring

  • הגדירו systemd service כדי שה-agent יחזור אוטומטית אחרי reboot
  • הגדירו log aggregation: תדעו מה ה-agent עשה בכל רגע
  • הגדירו health check cron: אם ה-agent קורס, תקבלו התראה
  • בצעו backup אוטומטי לקונפיגורציות

Claude Code: השינוי שאף אחד לא מדבר עליו

במהלך הבנייה השתמשתי ב-Claude Code, ה-CLI של Anthropic שרץ ב-terminal. וזה שינה את הדרך שבה אני בונה.

לא בגלל שהוא כתב קוד במקומי. אלא כי הוא נמצא ב-context מלא של הפרויקט בזמן אמת. הוא רואה את הקבצים, מבין את הארכיטקטורה, ויכול לזהות בעיות שאני לא ראיתי.

דוגמה מהפרויקט: שמתי לב שה-agent צרך פחות RAM ממה שציפיתי. Claude Code זיהה שה-config לא הגדיר memory limits נכון ל-container וש-NVIDIA OpenShell רץ עם heap גדול מהנדרש. תיקון של שלוש שורות. בלי Claude Code הייתי מבזבז שעות.

· · ·

מה זה אומר לעסק קטן: ההסבר הכן

מה נדרש ממך

מה צריך כדי להצליח
טכנאי או מפתח שיגדיר את ה-instance: לא עושים את זה לבד בלי ידע בסיסי
הגדרה ברורה של מה שה-agent אמור לעשות: ככל שהיעד מטושטש, כך הכישלון גדול
זמן הקמה: 1 עד 3 ימי עבודה ל-setup ראשוני, עוד שבוע לכיוון דק
$24 לחודש לתשתית ועלויות API בנוסף: תלוי בכמות השימוש
תחזוקה שוטפת: בדיקת לוגים, עדכוני אבטחה, שיפור ה-prompt עם הזמן

ROI: בחישוב ישיר

עלות חודשית שווה ערך ל
$24: תשתית Lightsail שתי שעות של עבודת מזכירה
$20 עד $50: API calls ממוצע שעה אחת של יועץ
סה"כ: כ-300 עד 350 שקל לחודש תחליף לעשרות שעות עבודה ידנית

כדי שזה יהיה כלכלי, ה-agent צריך לחסוך לכם יותר מארבע עד חמש שעות עבודה בחודש. אם אתם מנהלים לידים, תורים, משלוחים, תזכורות: זה חסכון של עשרות שעות בחודש. החשבון עובד.

· · ·

האבטחה: למה הפעם זה שונה

הבעיה הגדולה עם רוב כלי ה-AI בשוק היא שהנתונים שלך עוברים דרך שרתי צד שלישי. כשאתה כותב prompt ל-ChatGPT, אתה שולח מידע ל-OpenAI. כשה-agent שולח מייל דרך שירות ב-cloud, מישהו רואה את התוכן.

הארכיטקטורה של אבטחה ב-NemoClaw
Filesystem isolation: הנתונים שלך לא זמינים ל-agent מחוץ לתיקיות שהגדרת
Network policy: אתה מחליט איזה URLs ה-agent יכול לגשת אליהם
Full audit log: כל פעולה של ה-agent מתועדת
Local inference option: עם Nemotron מקומי, הנתונים לא יוצאים מהשרת שלך
Sandboxed execution: כל run של קוד קורה בסביבה מבודדת

המשמעות לעסקים: אם אתה עובד עם מידע רפואי, פיננסי, נתוני לקוחות: לראשונה יש דרך להריץ AI agent שמטפל בנתונים האלה מבלי שהם עוברים דרך צד שלישי. זה לא מושלם. אבל זה הבדל מהותי מ‘שלח את הנתונים לענן של OpenAI וקווה לטוב.’

· · ·

סיכום: מה לקחת מהמאמר הזה

OpenClaw + NemoClaw + Nemotron הם שילוש שהופך AI Agent מ‘מגניב לדמו’ ל‘ניתן לייצור’. NVIDIA השלימו פאזל שחסר.

זה לא להיות early adopter בשביל הסטטוס. זה להיות מוקדם מספיק כדי שכשזה יהפוך לנורמה, אתה כבר תדע איך להפעיל את זה.

בניתי את זה על $24 בחודש. ראיתי את זה עובד. ועכשיו אתם יודעים שזה אפשרי.
הצעד הבא
1. קראו את ה-README של NemoClaw: github.com/NVIDIA/NemoClaw
2. קראו את המאמר הקודם שלי על OpenClaw ו-Execution Topology
3. בחרו use case אחד שכואב לכם עכשיו: לידים, תורים, משלוחים
4. פנו אלי ב-LinkedIn אם אתם רוצים לדבר על ה-implementation

ירון גנד · Yaron Genad

AI Engineer & Architect

dnla.ai | LinkedIn | Medium

Similar Posts

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *