לקראת ChipEx2022: ביל מגרו, CTO למיחשוב HPC בגוגל ופיזיקאי קוונטי: אימון בינה מלאכותית דורש משאבים דומים לפרויקט מדעי

מַדָע

במשך עשרים שנה היה מגרו משתמש של מחשבי על פיזיקאי שערך מודלים והריץ אותם בכמה ממחשבי העל המעטים שהיו אז, אחר כך עבר לפתח את ה-HPC  באינטל והפך את הקונספט של מחשבים מקביליים חזקים ליותר נגיש וכעת הוא כאמור מקדם את הטכנולוגיה הזו הלאה בגוגל שם הוא מסתייע בבינה מלאכותית

ד"ר ביל מגרו, CTO למיחשוב עתיר ביצועים בגוגל קלאוד. צילום באדיבותו.
ד”ר ביל מגרו, CTO למיחשוב עתיר ביצועים בגוגל קלאוד. צילום באדיבותו

ביל מגרו, CTO מיחשוב עתיר ביצועים בגוגל: הענן יכול לשמש פתרון למחסור בשבבים. מגרו היה במשך 20 שנה פיזיקאי בתחום הפיזיקה הקוונטית שהשתמש במחשבי על להרצת מודלים מורכבים, אחר כך כעשרים שנה באינטל שם קידם את פיתוח תחום המיחשוב עתיר הביצועים כמוביל טכנולוגי ובשנתיים האחרונות הוא ה-CTO של תחום מיחשוב עתיר ביצועים וענן בגוגל,שלמרות מעמדה כמשתמש היא פיתחה שבבים שיאיצו את אימון מערכות הבינה המלאכותית וייעלו את קידוד הוידאו של יוטיוב.

ש: אנא ספר קצת על עצמך, על הקריירה שלך  ואיך התרחש המעבר מהאקדמיה לתעשייה

“בזמן שעבדתי במחשוב בעל ביצועים גבוהים כל הקריירה שלי, ההכשרה הרשמית שלי היא כפיזיקאי קוונטי. בבית הספר לתארים מתקדמים, המחקר שלי כלל עריכת סימולציות מקבילות בקנה מידה גדול של מערכות חומר מרוכזות, והיה לי מזל שהיתה לי גישה לארבעת מרכזי מחשבי העל של ארצות הברית, במימון הקרן הלאומית למדע”.

“ביצעתי את מחקר התואר השני שלי ב- NCSA באוניברסיטת אילינוי ואת עבודת הפוסט-דוקטורט שלי במרכז התיאורטי בקורנל (שניים מארבעת מרכזי הקרן הלאומית למדע של ארה”ב –  NSF). ההתנסויות הללו נתנו לי חשיפה למגוון רחב של ארכיטקטורות מערכת HPC ומודלים של תכנות יישומים, והחלטתי להמשיך את העניין שלי ב- HPC במקום להמשיך כחוקר פיזיקה.”

“הצטרפתי לחברה קטנה המספקת כלי תוכנה ל-HPC, שנרכשה על ידי אינטל. באינטל, ביליתי כ -20 שנה בתפקיד מנהיגות טכנית, פיתוח וביצוע אסטרטגיות כדי להקים ולהצמיח את עסקי ה-HPC. תחומי העניין המרכזיים שלי היו HPC וענן  והחלטתי בשנת 2020 להצטרף לגוגל קלאוד כדי להמשיך את המשרה המלאה הזו.”

ש: מה איפשר לא רק למשתמשים מתקדמים כמוך, אלא כמעט לכולם להשתמש במחשוב בעל ביצועים גבוהים?

“בימים הראשונים של ה-HPC, מחשבי-על היו יקרים מאוד ונדרשה התמחות ארוכה לתפעל אותם. היה גם חסם פיננסי גבוה לרכישה ותפעול של מערכות אלה. קבלת הגישה הייתה קשה, ואלה שהייתה להם גישה היו צריכים לעתים קרובות להיות מומחים לא רק בשימוש אלא גם ביישומי הסימולציה ומודלים.”

“דברים רבים השתנו והפכו את ה- HPC לנגיש יותר. ראשית, הופעתה של תוכנת HPC מסחרית מתוחכמת ונתמכת היטב הפחיתה את המורכבות הטכנית עבור משתמשים רבים, ואפשרה להם להתמקד בבעיות שהם רצו לפתור ולא ביישום הכלים עצמם. גורם חשוב נוסף היה העוצמה החישובית הגוברת של מערכות מבוססות מיקרו-מעבדים, שהובילו למעבר התעשייה לארכיטקטורות HPC מבוזרות או מקובצות.  המעבר לשרתי x86 סטנדרטיים בתעשייה התחזק ולינוקס התבגרה יותר, עלויות החומרה של מערכות HPC הופחתו באופן משמעותי.”

“עם זאת, נותרו מספר חסמים, ובהם הצורך במומחיות בתכנון ותפעול מערכות, הצורך במתקני מרכזי נתונים והעלות הגבוהה של תשתיות לא מנוצלות. הופעתה של HPC מבוססת ענן מסייעת להתמודד עם האתגרים שנותרו, והופכת את HPC לנגיש יותר מתמיד למספר גדל והולך של משתמשים.”

ש: מה ייחודי בפתרון של גוגל לתחום HPC?

כמו ספקי ענן אחרים, Google Cloud יכול להפעיל את מרבית עומסי העבודה הנפוצים בסביבות HPC. מה ששונה בענן של גוגל היא המחויבות שלה לעתיד פתוח, היברידי ורב-ענני. אנו חשים כי סביבות HPC היברידיות המשלבות משאבים מקומיים וענן הן לעתים קרובות הבחירה הטובה ביותר עבור לקוחות, ואנו מאמצים תקני טכנולוגיה פתוחים כדי לאפשר ניידות עומס עבודה – בין סביבות מקומיות, Google Cloud ואפילו סביבות מתחרות של ספקי ענן.

אנו גם מרגישים שיכולות הבינה המלאכותית והניתוח שלנו הן הטובות מסוגן, ואנו מסייעים למשתמשי HPC לנצל את היכולות הללו כדי להאיץ את זמנם לתובנות.

לבסוף, אנחנו אוהבים לראות את עצמנו יותר כשותף מאשר ספק, להביא את הטוב ביותר של Google להתקשרויות שלנו ולא רק מוצרים.

ש: מדוע גוגל כחברת אינטרנט/תוכנה עוסקת בפיתוח שבבים?

יש לנו שירותים מרובים, כשלכל אחד מיליארדי משתמשים הפרוסים ברחבי העולם. כדי לספק שירותים בקנה מידה כזה, הפכנו לאחד הצרכנים הגדולים בעולם של סיליקון מסחרי.

עם זאת, לעתים אנו רואים הזדמנויות לייעל את השבבים לשימוש בקנה מידה גדול מאוד. שתי דוגמאות טובות יהיו שבבי קידוד הווידאו שלנו, המספקים האצת חומרה בעלת ביצועים גבוהים מאוד וחסכוניים בצריכת חשמל עבור קידוד וידאו, ויחידות העיבוד Tensor שלנו, המספקות ביצועים ויעילות הספק הטובים מסוגם לאימון למידת מכונה.

ש. כיצד גוגל רואה את החשיבות של שבבים לתעשיית ההייטק וכיצד ייפתר המחסור בשבבים?

ידוע כי הביקוש לשבבים ממשיך לעלות, אך שיבושים בשרשרת האספקה משפיעים על הייצור, מה שמוביל למחסור חמור בשבבים. אמנם ברור שהגישה למשאבי מחשוב היא קריטית הן לתעשייה והן למוסדות מחקר, אך לא ברור כיצד ומתי ייפתר המחסור.

דבר אחד שאנחנו רואים הוא שלקוחות שבדרך כלל קונים מערכות מקומיות מגלים שהם יכולים לבצע את משימתם חודשים ולפעמים שנה קודם לכן על ידי גישה לתשתית גוגל קלאוד. קנה המידה העצום של הענן, בשילוב עם מודל הגישה המשותפת, הופך אותו לדרך אידיאלית למתן, אם לא לפתור, חלק מהבעיות הללו בשרשרת האספקה.

ש: מהו תפקידה של הבינה המלאכותית בתחום שלך?

בינה מלאכותית היא יכולת חשובה ביותר עבור Google, ואנו משתמשים בה במספר דרכים חדשניות, החל משיפור השירותים שלנו וכלה בהורדת טביעת הרגל הסביבתית של מרכזי הנתונים שלנו.

ב- HPC, במיוחד, בינה מלאכותית מעניינת במספר דרכים. ראשית, חלק מעומסי העבודה בתחום הבינה המלאכותית, כמו אימון למידה עמוקה, מפיקים תועלת או אפילו דורשים את אותם סוגים של תשתיות בעלות ביצועים גבוהים כמו אלה שמשמשים לצרכי הנדסה ומחשוב מדעי. במילים אחרות, יש הרואים בהכשרת למידה עמוקה עומס עבודה של HPC, והם פורסים אותו בסביבות HPC.

בינה מלאכותית גם משנה מגוון רחב של דיסציפלינות, מביאה יכולות חדשות ופרודוקטיביות משופרת לעובדים במגוון רחב של תעשיות. מדענים ומהנדסים שהיו משתמשי HPC עיקריים משתמשים גם בבינה מלאכותית כדרך להגביר את הפרודוקטיביות שלהם ולהאיץ את משך ההגעה לתובנה.

לבסוף, יש עניין פעיל ברחבי העולם בדרכים לשימוש בבינה מלאכותית כדי להאיץ ישירות את תהליך הסימולציה, ובכך לתרום תרומה נוספת לקיצור הזמן עד להסקת המסקנות. צוות המחקר של Google פרסם לאחרונה  תוצאות מבטיחות על האצת סימולציות דינמיקת נוזלים חישוביות, הנפוצות בתחומים כגון עיצוב מוצר, עיצובי מרכז נתונים וחיזוי מזג אוויר.

להרשמה לכנס ChipEx2022

עוד בנושא באתר הידען:

Leave a Reply

Your email address will not be published.