עליית המכונות 4: אחלה צנזורה, שובו של הויניל, הקיץ של קמאלה

Aug 20, 2024

שלום, ברוכים הבאים לגליון 4 הגדוש במיוחד!
הניוזלטר גדל במהירות, וכבר עברנו את ה-2,000 קוראים. זה משמח ומרגש אותי: אם כותבים על דברים מעניינים, יש מי שרוצה לקרוא.
מנהלות: אם לא יבטלו לי את הטיסות, אהיה בחופש ובשבוע הבא לא יצא מייל.

אם זה מעניין לכם, שתפו בבקשה גם עם חברים, ההרשמה מכאן:

https://rotm.co.il

. הפרוייקט הזה יחזיק מעמד רק אם יגיע למספרים משמעותיים.

נשיקות,
-מתי

זרקת רעיון, תן לחשוב

אז צנזורה זה טוב או רע? עד עכשיו זכינו ליהנות רק מצד אחד של הדיון: רוב מחוללי התמונות המסחריים משתדלים לחסום שימוש לרעה בתוכנה שלהם.
בקצה המרוחק ביותר של המפה היתה גוגל, שהמנוע שלהם imagen, הוסיף בעצמו מילים לבקשות שלכם כדי להכריח אותן לצאת מכלילות ומשתפות ככל האפשר. התוצאה היתה כמובן מגוכחת לחלוטין:

imagen diverse images — *הייתי חיילת סינית בשירות הוורמאכט*

מישהו בגוגל הבין את האבסורד, ושם פלסטר על הבעייה: מחולל התמונות סרב לייצר תמונות של בני אדם בכלל, מכל הסוגים. רק עכשיו יצאה הגירסה החדשה והמשופרת, imagen 3, (פתוחה רק לאמריקאים) שהיא עדיין די סרבנית, אבל כבר לא באופן מגוחך. (למי שזוכר את פיאסקו הגורילות הגדול מ-2015, נראה שגוגל חטפו שם כוויה רצינית. ודרך אגב, עד היום הם נמנעים מלנסות לזהות גורילות).

אבל עכשיו מגיע הצד השני של המטבע. המחולל החדש, Flux, שכתבנו עליו לפני שבועיים, יצא בקוד פתוח וחופשי לכולם. קודם כל, הוא מתירני מאוד כבר מהמפעל. יש לו מתג שמאפשר להדליק או לכבות את הצנזורה, וכל אחד יכול לבחור.
אילון מאסק אימץ אותו מייד. אם אתם מנויים בטוויטר, תוכלו לנסות את Grok2, מנוע השפה החדש שלהם, שיודע לגשת לגירסה החופשית של Flux, וחפרתי הרבה כדי למצוא כמה רגועות יחסית שלא יטרגרו אף אחד:

אבל אם תחפשו קצת (או תכינו בעצמכם), תמצאו את ביבי לובש ביקיני מדגל פלסטין, זוגות של פוליטיקאים שוכבים מבסוטים טופלס במיטה, אילון מאסק ומיקי מאוס אחרי ירי המוני בבית ספר. הכל, הכל. ובאיכות מעולה.

אבל זו רק ההתחלה. מכיון שהמודל מסתובב שם בחוץ, יש כבר דרכים ללמד אותו את מה שהוא לא למד בבית. זה מתחיל בדברים משעשעים, תמונות שלכם בחליפת סופרמן וכאלה (תכף נלמד איך להכין אחד בעצמנו). אבל זה מגיע לדברים קיצוניים ביותר. אם תיכנסו ל civit.ai, הבית של מאמני המודלים, ותסירו את הפילטר NSFW (לא אתן לינק ישיר, תסתדרו), תגלו שקהילת הפורנו, כמו תמיד, אימצה את הטריק הזה מיד. עדיין לא הופיעו הדברים הממש מוזרים, אבל תנו לזה קצת זמן.

ועכשיו, אוי אוי אוי, תכף ישתמשו בזה לפייק ניוז וסקאם?
כן. נכון. אנחנו כבר לגמרי מוקפים בזה: רמאויות של מליארדים תוך שימוש בהמלצות חיות של "אילון מאסק", אותו טריק, רק בארץ (בחיי שראיתי את זה בלייב עם פרופ' גמזו המזוייף, התלוננתי לפייסבוק והם לא חשבו שמשהו לא בסדר).
ב-OpenAI מוציאים דוח מיוחד אודות קמפיין השפעה איראני שהשתמש במשאבים שלהם (איך תפסתם אותם? אהה!! אז אתם כן מקשיבים לכל מה שאנחנו אומרים לצ'אט?). מובן שקמפיין איראני אמיתי עבר מזמן למודל החינמי החופשי Llama של פייסבוק, שאפשר להריץ בבית בשקט בלי שסאם אלטמן המרגיז יקשיב לכל מילה. ואני לא רוצה אפילו לחשוב מה יהיה עם תיכוניסטים שמפיצים תמונות מזויפות של בנות.

לסיכום, מודלים חופשיים הם כמו סכין מטבח. על כל מליון שחותכים סלט, יש אחד שהולך לעשות איתם פיגוע.

עוד בחדשות

נדם כינור נכבה ירח: תעשיית המוזיקה בצרות. אחרי שנים של ירידה במכירות, ענקיות הסטרימינג הזריקו מליארדים לחברות התקליטים והיה נראה שהכל סבבה. אבל כנראה שהמסיבה הזו נגמרה: בארה"ב השוק רווי לחלוטין, ובמקומות שיש גדילה, כמו בהודו נגיד, משלמים הרבה פחות כסף על המוזיקה. ההכנסות תקועות ואף יורדות.
הפתרון הנראה לעין: עלייתו של ה Super-Fan - המעריצים שיסכימו לשלם מנוי פרימיום בתמורה לגישה מוקדמת למוזיקה החדשה, מרצ' ותופינים. נראה אם זה יעבוד.
החלק הכי מפתיע: חברת יוניברסל ניצלה מהפסד מחפיר, כי הייתה עלייה של 9% ברכישת תקליטי ויניל! מפתיע (ועוד סימן לקיומו של ה Super Fan המתעתע). לינק

המדען האוטומטי: חברת "סכנה" היפנית (בעברית זה יותר טוב, ביפנית זה "דג") מציגה את מדען ה-AI. המדען שלהם חושב על רעיונות מעניינים, בודק שהם מקוריים, כותב להם קוד, ובודק את התוצאות. בסוף הוא מפיק מאמר מדעי אמיתי כמו שצריך, מראה אותו לחברים ה-AI שלו, ומתקן ומשתפר לפי ההערות שקיבל.
התוצאה היא עדיין מאמרים רעועים למדי, אודות תגליות פעוטות.
חוקרי החברה, ובראשם David Ha המוכשר, לא מגזימים בתיאור התוצאות (יפנים..), ונותנים ניתוח מפוכח של מה עובד פה ומה לא. צוות מעולה, דייויד מבריק, אני צופה שעוד נשמע מהם דברים מעניינים מאוד.

הקיץ של קמאלה: זכרו שהעסק יכול לעבוד גם הפוך. אפשר לצעוק "פייק!" על דברים אמיתיים.
תומכי טראמפ טענו שהקהל שהגיע להריע באירוע של קמאלה היה פייק ובמציאות היה ריק בלי אף אחד, וכולם הושתלו ב-AI. בחור אחד הגדיל לעשות: "אם זה היה קהל אמיתי, למה אין תמונות של הקהל מעוד זוויות??".
אבל זהו, שכמובן יש המון זוויות אחרות לאירוע שסוקר בהרחבה, אבל אז יש עוד "הוכחות" שאנשים בקהל הם AI, ואז עוד הוכחות נגד. הנה שירשור אחד כזה.
אוף. הולכים להיות לנו עוד כל כך הרבה כאלה. הטייק החשוב: ההוכחות משני הצדדים לא שינו את דעתו של אף אחד במילימטר.

דברים לספר בארוחת צהרים בעבודה

היום המדור יהיה אומנותי ותרבותי, לקט מתוך הזוכים של פרס לומן ל-2024:

שוליית הקוסם: קנת למברט מפזר חול שחור על הרצפה, ואז חבורה עליזה של איירובוטים מטאטאת את החול ועושה ציורים. וידאו

art of irobots — *אני עשיתי תה, אז אתה תטאטא*

טיפת מזל: רחפן טס מעל שדה תילתן ומחפש לו תילתנים עם 4 עלים. זה יפה

דבר אלי: האומנית חיברה חיישני תנועה לרקדנים, ומיפתה את התנועות לחלקים שונים בפה האנושי. הרקדנים, אחרי אימון, יכולים להרכיב הברות למילים שלמות וממש לשיר את התנועה שלהם. רננה רז, אם את קוראת את זה..

בינה מלאכותית לנסות בבית

אז איך אפשר ללמד את פלאקס לייצר משהו חדש, שהוא לא ראה מעולם? זה עובד עם תמונות שלכם (או של מישהו אחר), עם מוצרים וחפצים, וגם עם סגנונות ספציפיים. השם המקצועי הוא LORA, ובפשטות רבה אפשר לחשוב על זה כמו מתאם קטן שמלבישים על המודל הגדול, ומוסיף לו ידע חדש שלא היה שם קודם.

יש הרבה דרכים לעשות את זה, עברתי על כולן ומצאתי את זו שהכי פשוטה וידידותית.
התקציב הנדרש: $6 - $10 (כן, יש גם בחינם, צריך מחשב חזק, סבלנות ברזל, וקצת פייתון).
מוכנים?

1 - תמונות שלכם
במפתיע, זה השלב הקשה ביותר, והרוב נופלים דווקא בו. תהיו חזקים. אתם צריכים לאסוף 20 תמונות שלכם. חשוב מאוד לבחור אותן היטב, כי יש לזה השפעה רצינית מאוד על התוצאה שתקבלו. הנה כמה דגשים חשובים:
- 20 תמונות שונות לגמרי: יום אחר, זוית אחרת, אור אחר, גיל אחר. חשוב לראות את הפנים היטב, אבל שימו גם תמונות של חצי גוף ואפילו גוף שלם פה ושם. המודל ידע למצוא את המשותף ביניהן, אבל אם הן דומות מידי, הוא לא ילמד מספיק. לא חייבים 20 בול, 15 גם יהיה בסדר. אבל שיהיו טובות.
- רק אתם בתמונה. אם יש שם מישהו אחר, תחתכו אותו.
- תמונות שאתם יפים וצעירים עובדות טוב יותר. סמכו עלי פה. אם טרם הבנתם, אנחנו לא בעסקי המציאות כאן.
הנה התמונות שלי לדוגמה. תשמרו את התמונות שאספתם. עוד חצי שנה יצא מודל יותר מדהים ויבקש מכם את אותו הדבר בדיוק.

2 - מאמנים את המודל (אתם 20 דקות מהתהילה)
א. הירשמו לאתר גיטהאב. למה? כי לאתר שאנחנו צריכים, fal.ai, אפשר להכנס רק עם משתמש של גיטהאב.

ב. חמושים בחשבון גיטהאב פעיל, כנסו לדף האימון כאן. כנראה שתראו בכתום זוהר את האזהרה שאין לכם מספיק כסף בקופה, Insufficient credits. בפינה הימנית העליונה, ליד תמונת הפרופיל שלכם, יש כפתור "+". הוסיפו כסף - צריך לפחות $6, אבל אני ממליץ להוסיף $10, כי אתם הולכים לייצר הרבה תמונות יפות שלכם אחר כך.

ג. אחרי שמילאתם כסף, חזרה לדף האימון, תראו בתמונה פה. העלו את אוסף התמונות שלכם, לחצו על More, והכניסו את מילת הטריגר. בחרו מילה שאינה קיימת באנגלית בד"כ (למשל השם שלכם). את כל השאר האופציות אפשר להשאיר כמו שהן.
זהו, אפשר ללחוץ על כפתור Start הסגול שלמטה, את שלכם עשיתם. האימון לוקח בסביבות רבע שעה, תלוי בעומס.

ד. בסוף האימון, תקבלו בצד ימין רשימת קבצים. העתיקו ממנה (יש כפתור) את הלינק של ה-LORA, ואז קפצו לדף שבו מכינים את התמונות. שוב פעם יש More שפותח טופס ארוך. הפעם, גשו ל Loras והוסיפו שם את הלינק שהעתקם הרגע (לינק ארוך שנגמר ב lora.safetensors)

ה. זהו! כתבו פרומפטים והכינו תמונות יפות. זכרו להשתמש במילת הטריגר שבחרתם בסעיף ג. כלומר במקום סתם a cowboy, כתבו matty as a cowboy.
פלאקס אוהב פרומפטים ארוכים ופיוטיים, אני גנבתי את הדייג הזה מכאן - רק זכרו להכניס את המילה שלכם בכל מקום רלבנטי, ולהסיר כל דבר שעלול לקלקל (נגיד, אני הורדתי את "deep blue eyes" מהפרומפט, כי בואו).

דייג בים הצפוני — *אם לא יעורו כל מלחיה*

בונוס: וידאו

אם יש לכם תמונה כזו מוצלחת, למה לא להפוך אותה לסרט?
מלכת הוידאו כרגע היא ללא ספק runway, שהופכת את התמונה שלכם לוידאו חד כתער.
המודל שלהם נקרא gen-3 והוא לא בחינם. המינימום הוא מנוי לחודש אחד שעולה $15 (זכרו לבטל אותו מיד..), ונותן קרדיטים שנגמרים בטיל.
נרשמים, מעלים את התמונה היפה שלכם ל gen-3 (זו תהיה התמונה הראשונה של הסרט). מוסיפים פרומפט פשוט "a fisherman is sailing in the sea" או משהו כזה. שימו לב שזה עובד טוב במיוחד כשהתמונה רומזת כבר על סוג התנועה (רואים גלים..). אם זו תמונה שלא ברור מיד מה קורה בה, זה יתן לכם תוצאות פחות מוצלחות.

אם זה יקר לכם, אפשר בחינם אצל לומה או אצל קלינג. זה מייצר סרטים מעט פחות טובים ולוקח יותר זמן המתנה (אפשר לזרז אם משלמים).

אם הגעתם לכאן, כל הכבוד! אתם בנבחרת.

עדכונים מחברי הקהילה

טוב זה ממש משונה. בשבוע שעבר הוצפתי בדברים שרציתם לפרסם כאן, והשבוע כלום, ריק.
אז אני מזכיר שוב את ההזדמנות הזו לפנות לכל הקהילה עם משהו שאתם עושים: פרויקט מעניין, משהו מעניין שכתבתם, כנס או הרצאה. דברים שקשורים לנושא שלנו (ויסוננו בקפידה).

שלחו את העדכונים בטופס כאן.

נתראה בשבוע הבא!

Elad Kobi

Aug 29, 2024Edited

קודם כל - תודה רבה! הניוזלטר אדיר!

לגבי Flux - ניסיתי בבית!

יצא לי קצת יותר מ-10$ (סביב ה-30) כי לקח לי קצת זמן להבין איך הפרומפט עובד, אממה, התוצאה הסופית הייתה מדהימה.

אני חושב שהבעיה היא שהוא מג׳נרט כל פעם תמונה מחדש ואי אפשר לתת לו פקודות המשך כמו Chat GPT.

למשל אם אהבתי תמונה מסוימת ורציתי לשנות בה משהו (גוון שיער / רקע) הוא לא הצליח להבין את זה. זה בעיניי משהו שחייב להשתנות שיהיה אפשר ממש לתקן ולדייק אותו.

Discussion about this post

Ready for more?