|   15:07:40
מועדון VIP
להצטרפות הקלק כאן
בימה חופשית ב-News1
בעלי מקצועות חופשיים מוזמנים להעביר אלינו לפרסום מאמרים, מידע בעל ערך חדשותי, חוות דעת מקצועיות בתחומים משפט, כלכלה, שוק ההון, ממשל, תקשורת ועוד, וכן כתבי טענות בהליכים בבית המשפט.
דוא"ל: vip@news1.co.il
כתבות מקודמות
קבוצת ירדן
כל מה שרציתם לדעת על קנביס רפואי
כתיבת המומחים
טיפול בתא לחץ: להתחזק בנשימה

הדור הבא של אחסון נתונים: אפקטיביות בעזרת בינה מלאכותית

יהיה אפקטיבי יותר להקצות ולהגדיר את המטא-נתונים כבר במקום שבו נוצרים הנתונים ומאוכסנים בראשית הדרך - ללא צורך להעביר את הנתונים. כתוצאה מכך, בעתיד, תידרש טכנולוגיית האחסון שתשמש לצורך זה להציג רמה גבוהה יותר של חוכמה המובנית בה עצמה, באופן שיאפשר לה ליצור את התגים המלווים את המידע המאוחסן. בעיקרון, מערכות SSD כבר כוללות את הרכיבים החיוניים הנדרשים על-מנת לשמש כישויות מחשוב
10/02/2019  |   נועם מזרחי   |   מאמרים   |   תגובות
[צילום: AP]

קצב ייצור הנתונים כיום גבוה מכפי שאפשר היה לדמיין אי-פעם. בעבר, היו בני אדם המקור העיקרי של ייצור נתונים חדשים. כיום נוספים על הנתונים האלה גם מגוון רחב של מקורות - דוגמת מצלמות אבטחה, חיישנים, רחפנים, מכוניות מקושרות לרשת, מכשירי IoT ופיסות ציוד ייצור. כל אלה יוצרים נתונים במגוון רחב של דרכים ופורמטים. אלא שיש להבדיל בין נתונים ובין מידע. כיום, רק שבריר מהנתונים הנאספים חשובים מספיק על-מנת שנטפל בהם כנכס אמיתי. קחו, למשל, מצלמת אבטחה: זה המקום שבו דקה בודדת של פעילות רלוונטית היא שמשנה באמת, ולא השעות הארוכות של וידאו שבהן לא מתרחש דבר מה חשוב באמת. אם להציע אנלוגיה, ניתן לחשוב על "נתונים" כמכרה שבו מחפשים אנשים אחר מטילי זהב, שהם ה"מידע". היכולת להפוך את הנתונים למידע בעל ערך - פעילות ה"כרייה", לענייננו - יכולה להיות מוגדרת כ"ניתוח אנליטי של ביג דאטה".

הגרף המובא כאן, שהוכן על-ידי אנליסטים בחברת המחקר Statistica, מתאר את הזינוק העצום בקיבולת הנתונים המאוחסנים, במהלך העשור האחרון. הניתוח הזה חוזה כי בשנת 2020 יגיע הביקוש לאחסון ל-42,000 אקסא-בייט. אולם הרוב המוחלט של הנתונים המאוחסנים - לפחות 80% על-פי רוב ההערכות - עודו מאופיין בפורמט בלתי מובנה (Unstructured data) לחלוטין, מה שמציג בעיות כאשר מנסים להשתמש בנתונים האלה לצורך ניתוח אנליטי. ההערכות אומרות כי רק 5% מהמידע המאוחסן אכן מנותחים בפועל. מובן כי ככל שנמצא דרך לצרף לנתונים בפורמט בלתי מובנה גם את המטא-נתונים המתארים אותם באופן אפקטיבי, בהקשר של הניתוח המתבצע - נוכל לנתח כמויות גדולות הרבה יותר של נתונים, תוך הגדלה משמעותית של הערך אותו מפיקים ארגונים מהנתונים שבבעלותם.

בינה מלאכותית (AI) נחשבת כיום לטכנולוגיה הצפויה להשפיע משמעותית על כל היבט של החברה המודרנית. הטכנולוגיה הזאת כבר הוכיחה את ערכה בתחומי ההמלצות על מוצרים בעולם המסחר המקוון, תרגום שפה טבעית, טכנולוגיות בעולם הפיננסים - FinTech, מערכות מעקב ואבטחה, זיהוי אוביקטים ומעקב אחריהם. בעולם הרפואה, התקדמה הטכנולוגיה עד לאפשרות האצת ההצבעה על תאים סרטניים מסכני חיים, או אנומליות אחרות. למרות השונות בין היישומים האלה, עוברת ביניהם נימה אחת משותפת: לראשונה אי-פעם, יש בידינו טכנולוגיה המסוגלת לסרוק כמויות עצומות של מידע בלתי מובנה - בכל צורה של וידאו, טקסט, קול, תמונות וכיוצא באלה - ולעבד אותן באופן המאפשר להפיק מהן ערך אמיתי. כך, ניתן להשתמש בבינה מלאכותית לא רק לצורך התהליך האנליטי עצמו - אלא גם לעיבוד מקדים של נתונים גולמיים בפורמט בלתי מובנה, על-מנת לתייג אותם ולהוסיף להם מטא-נתונים המייצגים אותם באופן פשוט אך מדויק. בסיס הנתונים המפושט הזה יכול בהמשך להיות בסיס לניתוח, באמצעות שכבות גבוהות יותר של תוכנה אנליטית לעיבוד ביג דאטה, על-מנת להפיק מידע שימושי מתוך הנתונים. בינה מלאכותית היא הטכנולוגיה שלה המתינו ארגונים, על-מנת שתאפשר להם להפיק הרבה יותר מהנתונים אותם הם מאחסנים - ואשר עד עתה, ברוב המקרים, נותרו "אפלים", בלתי גלויים במהותם.

אנחנו רוצים, אם כך, לייצר מטא-נתונים שיאפשרו לתוכנה האנליטית שלנו לפעול באופן אפקטיבי יותר ויש בידינו כלי בינה מלאכותית המאפשרים ליצור את המטא-נתונים שיאוחסנו בבסיס הנתונים שלנו, על בסיס כמויות עצומות של מידע בלתי מובנה. עכשיו, אנחנו צריכים רק להביא את כמויות הענק של הנתונים האלה אל מערכות הבינה המלאכותית שלנו, בכל מקום שבו הן עשויות להימצא, על-מנת שיוכלו לעשות את עבודתן. אבל, רק רגע. האם זו באמת הדרך הנכונה לפעול בה?

אם ניקח את שני המקומות העיקריים שבהם נוצרים נתונים ומאוחסנים כיום - "הענן" ו"שולי הרשת" (edge), מתברר במהירות כי הזזת כמויות העתק של הנתונים האלה ממקום למקום היא עניין יקר, שראוי להימנע ממנו. בענן, ניתוב הנתונים דרך מרכז עיבוד הנתונים ייצור עומסים על תשתיות הרשת הקיימות, יצרוך כמות גדולה של חשמל ועוצמת עיבוד, ויגדיל את רמות ההשהיה - תוך תוספת לזמן העיבוד הכולל. בדומה לכך, בשולי הרשת, ניתן למצוא רק משאבי מחשוב וחשמל מוגבלים. היכולות המוגבלות בכל הנוגע לקצבי העלאה של נתונים ממכשירים קטנים הנמצאים בשולי הרשת יהפכו את משימת ההעלאה של כמויות גדולות של נתונים אל הענן לתהליך בלתי מעשי. בשני המקרים, צמצום כמות הנתונים אותם אנו מעבירים ממקום למקום, והסתמכות על מטא-נתונים המייצגים את המידע השמור בהקשר של הניתוח המבוקש, מהווים מפתח לייעול התפעול.

מכל הסיבות שהוזכרו כאן, כמו גם מאחרות, יהיה אפקטיבי יותר להקצות ולהגדיר את המטא-נתונים כבר במקום שבו נוצרים הנתונים ומאוכסנים בראשית הדרך - ללא צורך להעביר את הנתונים. כתוצאה מכך, בעתיד, תידרש טכנולוגיית האחסון שתשמש לצורך זה להציג רמה גבוהה יותר של חוכמה המובנית בה עצמה, באופן שיאפשר לה ליצור את התגים המלווים את המידע המאוחסן. בעיקרון, מערכות SSD כבר כוללות את הרכיבים החיוניים הנדרשים על-מנת לשמש כישויות מחשוב. היכולות האלה משמשות באופן רגיל רק בהקשר של תפעול הכונן עצמו, אולם אפשר להקצות אותן בחלקים מהזמן לייעוד חדש של ביצוע משימות הקשורות בפונקציה אותה ממלאת המערכת, ולטפל בעבודה, תוך השלמה על-פי הצורך של רכיבי חומרה, תוכנה או קושחה נוספים הנדרשים על-מנת להשלים משימות ופונקציות כאלה. אחת מהגישות לפעולה עשויה להיות שימוש בחלון הזמן שבו עומד הכונן ללא שימוש פעיל (idle), על-מנת לבצע משימות מיפוי הפועלות ברקע.

גישה אחרת, עשויה להיות עיבוד הנתונים תוך כדי כתיבתם לכונן. חיסכון בחשמל ובעלויות, כמו גם צמצום הצורך בהעברת נתונים וקיצור זמני ההשהיה, יחד עם הקטנה של כלל התעבורה ברשת, הם רק כמה מהיתרונות אותם ניתן להפיק כאשר משתמשים בגישת האצת עיבוד כזאת כבר בנקודת האחסון, וככל שהגישה מיושמת במקרים הנכונים. היכולת המובנית למידרוג והרחבה של הגישה הזאת, אומרת כי ארגונים וספקי שירותי ענן יכולים להרחיב את היקף היכולות שלהם באמצעות מינוף הפונקציונאליות המתקדמת המתאפשרת באמצעות כלי AI עדכניים.

במהלך כנס Flash Memory Summit, שהתקיים בסנטה קלארה קליפורניה באוגוסט אשתקד, הציגו Marvell ו- NVIDIA מערכת ראשונה מסוגה של הוכחת יכולת לעיבודי AI על גבי כונני SSD, שהדגימה את האופן שבו ניתן לבצע משימות תיוג נתונים באופן יעיל - ללא צורך לגשת אל משאבי המעבד המרכזי (CPU) של המחשב המארח - ותוך הימנעות מבעיות העלויות ומההשהיה. משתתפי הכנס ראו כיצד בקרים של Marvell המוצעים כמוצרי מדף למרכזי עיבוד נתונים ולמערכות SSD, בעבודה משולבת עם טכנולוגיית האצה ליישומי למידה עמוקה (Deep Learning) - NVDLA - המפותחת על-ידי NVIDIA, קולטים מודל בינה מלאכותית שעבר אימון והדרכה, מבצעים הידור שלו ((compilation לעותק המתאים לעבודה עליהם וסורקים בסיס נתונים גדול של מידע בלתי מובנה, דוגמת ספריית וידאו, המאוחסן על גבי הכונן. מכאן, נוצרים תגים ונוצר בסיס נתונים של מטא-נתונים, המייצג באופן נוח לשימוש את הנתונים בהקשר של החיפוש העתיד להתבצע עליהם.

כך, למשל, אם המטרה היא אבחון וזיהוי אוביקטים או סצינות, עשוי מנוע הבינה המלאכותית לסרוק את קבצי הווידאו המאוחסנים על גבי הכונן ולבנות רשימת מטא-נתונים של רגע ההופעה של אוביקט או סצינה לאורך הווידאו הזה. בזכות טכנולוגיית האחסון החדשה המשופרת באמצעות כלי בינה מלאכותית, ניתן לשמור על בסיס הנתונים הכולל את המטא-נתונים בסביבה המקומית, על גבי ה- SSD - ולהפוך אותו זמין לטיפולה של תוכנה אנליטית שתבחן את המטא-נתונים ככל שיידרש. אם לחשוב, למשל, על גופי אכיפת חוק המחפשים אחר "חפץ חשוד" במקום כל שהוא לאורך שעות אינסופיות של קבצי וידאו ממצלמות אבטחה, ניתן להעלות מודלים מאומנים היודעים לזהות בדיוק "חפץ" כזה, ולהריץ במקביל את תוכנת התיוג על גבי כל תוכן וידאו זמין, לרוחב כל כונני האחסון עליהם מנוהל הווידאו הזה במקביל. כל הופעה של ה"חפץ" תסומן ותתויג, באופן שיהפוך את משימות הניתוח העתידי לקלות יותר ומהירות יותר.

בדומה לכך, ניתן לחשוב על האפקטיביות של ארכיטקטורה כזאת למשל דוגמת ניתוח אנליטי המתבצע ברקע הפעילות של צ'אטבוט, כאשר יש לסרוק בסיס נתונים גדול של שיחות צ'אטבוט ששמורות במערכת, על-מנת לעדכן את מודל הדיבור של הבוטים ולשפר את איכות השירות. אפשר יהיה למדוד ולהעריך מתי משתמשים מרוצים או מוטרדים מהתשובות אותן הם מקבלים, האם השיחות ארוכות מדי או קצרות מדי, וכיוצא באלה. ברגע שבו נוצר מודל בינה מלאכותית היודע לעקוב אחר הפרמטרים המסוימים האלה, אפשר להדר ולהריץ אותו על גבי מנוע בינה מלאכותית הפועל כבר במערכת האחסון, ולסרוק את השיחות בזמן אמת ובעיבוד אצווה, במקביל. ביישומים דוגמת הכנסת פרסומות מכווני לקוח ואשר מושפעים מהמתרחש בסטרימינג של וידאו, חיפוש במאגרי וידאו של מצלמות מעקב ואבטחה וביישומים אחרים עתירי תנועות קלט-פלט, מינוף הקרבה לנתונים מציג יתרונות משמעותיים בכל הנוגע לביצועים.

טכנולוגיית בקרי SSD משולבי בינה מלאכותית שבה מתייצבת Marvell כחלוצה, מדגימה כיצד ניתן ליישם ארכיטקטורות חדשות לאחסון נתונים שיתאמו למגוון רחב של יישומים תובעניים בתחומי ה- Big Data, ההולכים ומופיעים בשוק - ללא צורך במערכות מעגלים משולבים יקרים הנבנים במיוחד לצורך זה. כאשר נותנים לחומרת SSD הזמינה ונפוצה כבר בשוק בנוסף ליכולות לוגיקה אותן ניתן להוסיף למערכת - הן הופכות חכמות משמעותית. המטא-נתונים והתגים החיוניים לטיפול בעומסי עבודה עתידיים של ניתוח אנליטי יכולים להיות מטופלים ישירות כבר ברמה המקומית - ללא צורך בתקשורת אל משאבי עיבוד ייעודיים כל שהם.

יישום הטקטיקה החלופית הזאת, במקום הסתמכות על עיבוד מרכזי קונבנציונאלי, יהפוך את התהליכים כולם ליעילים הרבה יותר. הוא יצרוך רק את מינימום רוחב פס התקשורת הזמין, וימנע היווצרות של צווארי בקבוק. כאשר מאיצי עיבוד לבינה מלאכותית משולבים ישירות בבקרים חסכוניים של מערכות SSD, כבר ברמת המעגלים המשולבים של הבקר עצמו, אפשר יהיה להשלים במהירות משימות ניתוח אנליטי - הכל תוך צריכה נמוכה משמעותית של קיבולת עיבוד ושל ההספק הנצרך, והימנעות מהצורך לתכנן מן היסוד שבבי ASIC ייעודיים ומורכבים במיוחד הנדרשים לביצוע המשימות האלה. בזכות השימוש בארכיטקטורה ניתנת לתכנות, תתרחב גם האפשרות להקצות משאבי מערכות לצורך עידכון מודלים של בינה מלאכותית המשובצים במערכות האחסון - ואפשר יהיה לטפל ולפתח גם יישומים ושימושים חדשים.

Marvell Fellow, VP Technology and Architecture, Marvell CTO office
תאריך:  10/02/2019   |   עודכן:  10/02/2019
נועם מזרחי
מועדון VIP להצטרפות הקלק כאן
פורומים News1  /  תגובות
כללי חדשות רשימות נושאים אישים פירמות מוסדות
אקטואליה מדיני/פוליטי בריאות כלכלה משפט סדום ועמורה עיתונות
הדור הבא של אחסון נתונים: אפקטיביות בעזרת בינה מלאכותית
תגובות  [ 0 ] מוצגות   [ 0 ]  לכל התגובות        תפוס כינוי יחודי            
תגובות בפייסבוק
ברחבי הרשת / פרסומת
רשימות קודמות
"רפול הביא אותי במכונית להפגנה נגד הממשלה שנערכה מול חלונות ראש הממשלה" אמרה עפרה מאירסון, מי שהייתה רעייתו של רפאל איתן (רפול) בראיון לרוני הדר בעיתון הארץ ב-3.1.2006 .
10/02/2019  |  איתן קלינסקי  |   מאמרים
יו"ר הרש"פ איננו מרפה מרצועת עזה. הוא ממשיך באיטיות ובהדרגה לנסות ולדחוף את הרצועה לעבר פיצוץ פנימי בפני שלטון חמאס, שעלול לגלגל את הפיצוץ ההומניטרי לעברה של ישראל.
10/02/2019  |  יוני בן-מנחם  |   מאמרים
בני גנץ ביקש לעקוף ולטשטש בנאומו את קווי המחלוקת בין ימין לשמאל. למען בחירה דמוקרטית מודעת, במיוחד לאחר התבטאותו על האפשרות להינתקות נוספת, ראוי לשחזר ולהבליט את קווי היסוד למחלוקת.
09/02/2019  |  גרשון הכהן  |   מאמרים
בני גנץ רוצה להיות יצחק רבין - אבל הוא לא. הוא לעולם גם לא יהיה. הוא דומה יותר לכלי ריק. אין בו מאומה שאפילו מזכיר את רבין. וחשוב להיזכר: רבין, לקראת הקדנציה השנייה שלו, ב-1992, היה איש מנוסה מאוד, מי שכבר כיהן הן כראש ממשלה והן כשר ביטחון. ולפני כל אלה, הוא גם שימש שגריר בארצות הברית. כל זה לא מנע מרבין, כמובן, מלעשות טעות קולוסאלית, מדממת, שנכנסה עד מהרה למצעד האיוולת העולמי, אבל לא בזה העניין.
08/02/2019  |  ד"ר חיים משגב  |   מאמרים
זה היה השבוע של הליכוד. בשבוע הבא תבחר העבודה את מועמדיה לכנסת. מה סיכויו של ח"כ איתן כבל להתברג לרשימה, ולמה הפסיד השר. איוב קרא את הזדמנות חייו? על שטרות של 200 שקלים מזויפים שמציפים את הארץ, ועל מפקד תחנת משטרה בצפון שמציע את תבשיליה של רעייתו, בתחנת המשטרה, כמובן תמורת תשלום.
08/02/2019  |  משה נסטלבאום  |   מאמרים
בלוגרים
דעות  |  כתבות  |  תחקירים  |  לרשימת הכותבים
חיים רמון
חיים רמון
יש רבים בדרג הצבאי ובדרג המדיני שהיו צריכים ללכת הביתה עוד לפני חליוה, ואני מקווה שכך יקרה בעתיד הקרוב
איתמר לוין
איתמר לוין
למחדל של 7 באוקטובר מוסיפה הממשלה את סכנות החורבן הכלכלי, האנטישמיות והמפלגתיות בארה"ב    הערות על נצח יהודה ומינוי ראש אמ"ן, ולקח מאיר עיניים ממשה רבינו
דן מרגלית
דן מרגלית
ביבי ראש, ביבי אשם    נתניהו היה חייב להתפטר דקה אחת לפני הרצי הלוי ורונן בר    איני בא לטעון כי חליוה אינו צריך להתפטר, צריך גם צריך אחריהם? איתם? לא חשוב
יורם דורי
יורם דורי
ההתמודדות על הנהגתה של מפלגת העבודה הפכה למשאל חברים האם תנועה מפוארת זו תשרוד או תפורק, תיטמא במפלגות אחרות ותיקבר בבית הקברות של ההיסטוריה יחד עם תנועות אחרות שזנחו את האידיאולוג...
אמיר אביבי
אמיר אביבי
המתקפה האירנית כשלה לחלוטין והעניקה למדינת ישראל הזדמנויות להבין את כוחה מול אירן, ליצור בריתות חשובות, לרתום את דעת הקהל העולמית, ולקבל חופש פעולה בעזה ובלבנון    עם זאת, המתקפה גם...
לרשימות נוספות  |  לבימה חופשית  |  לרשימת הכותבים
הרשמה לניוזלטר
הרשמה ל-SMS
ברחבי הרשת / פרסומת
ברחבי הרשת / פרסומת
News1 מחלקה ראשונה :  ניוז1  |   |  עריסת תינוק ניידת  |  קוצץ ירקות מאסטר סלייסר  |  NEWS1  |  חדשות  |  אקטואליה  |  תחקירים  |  משפט  |  כלכלה  |  בריאות  |  פנאי  |  ספורט  |  הייטק  |  תיירות  |  אנשים  |  נדל"ן  |  ביטוח  |  פרסום  |  רכב  |  דת  |  מסורת  |  תרבות  |  צרכנות  |  אוכל  |  אינטרנט  |  מחשבים  |  חינוך  |  מגזין  |  הודעות לעיתונות  |  חדשות ברשת  |  בלוגרים ברשת  |  הודעות ברשת  |  מועדון +  |  אישים  |  פירמות  |  מגשרים  |  מוסדות  |  אתרים  |  עורכי דין  |  רואי חשבון  |  כסף  |  יועצים  |  אדריכלים  |  שמאים  |  רופאים  |  שופטים  |  זירת המומחים  | 
מו"ל ועורך: יואב יצחק © כל הזכויות שמורות     |    שיווק ופרסום ב News1     |     RSS
כתובת: רח' חיים זכאי 3 פתח תקוה 4977682 טל: 03-9345666 פקס מערכת: 03-9345660 דואל: New@News1.co.il