שימשו באלגוריתמים מבוססי בינה מלאכותית (Artificial Intelligence- AI) לצורך הערכה עצמאית של בדיקות ממוגרפיה המבוצעות במסגרת בדיקות סקר לזיהוי מוקדם של סרטן שד לא נבדקו עבור עוקבה גדולה של נשים ממוצא אסיאתי. במחקר זה החוקרים השוו בין הערכה המבוצעת על ידי רדיולוגים לבין AI בלבד לסקירה של ממוגרפיה, עם התחשבות בצפיפות שד, עבור נשים קוריאניות.
עוד בעניין דומה
במחקר רטרוספקטיבי זה נכללו 89,855 נשים קוריאניות אשר עברו בדיקת סקר ראשונה באמצעות ממוגרפיה בין השנים 2009-2020. הופעת סרטן שד, על פי המרשם הלאומי לסרטן, תוך 12 חודשים היווה נקודת הייחוס. החוקרים השתמשו בחומרה Lunit על מנת לקבוע את ההסתברות לממאירות, עם סף של 10% עבור זיהוי של סרטן שד. הביצועים של AI הושוו לדירוג BIRADSי(Breast Imaging Reporting and Data System) שנתנו רדיולוגים מומחים לשד. צפיפות השד דורגה לפי סרגל של ארבע קטגוריות (A-D) לפי הערכת רדיולוג ושל AI. מדדי תפקוד (שיעור זיהוי ממאירות [cancer detection rate-CDR], רגישות, סגוליות, ערך מנבא חיובי [Positive Predictive Value- PPV], שיעור כיסוי ושטח שתחת העקומה האופיינית למסווג [Area Under the Receiver Operating Characteristic Curve - AUC]) הושוו בין נבדקות בתוך קבוצות צפיפות השד.
גילן הממוצע של הנבדקות עמד על 43.5±8.7 שנים, כאשר 143 מקרים של סרטן שד זוהו תוך 12 חודשים. תוצאות המחקר הדגימו כי לא נמצא הבדל מובהק סטטיסטית ב-CDR (1.1/1,000 בדיקות) וברגישות בין רדיולוגים מומחים לבין AI (69.9%, רווח בר-סמך של 95%, 61.7-77.3 לעומת 67.1%, רווח בר-סמך של 95%, 58.8-74.8). עם זאת, האלגוריתם של AI הדגים סגוליות (93%, רווח בר-סמך של 95%, 92.9-93.2 לעומת 77.6%, רווח בר-סמך של 95%, 61.7-77.9), PPV (1.5%, רווח בר-סמך של 95%, 1.2-1.9 לעומת 0.5%, רווח בר-סמך של 95%, 0.4-0.6), שיעור כיסוי (7.1%, רווח בר-סמך של 95%, 6.9-7.2 לעומת 22.5%, רווח בר-סמך של 95%, 22.2-22.7) וערכי AUC (0.8, רווח בר-סמך של 95%, 0.76-0.84 לעומת 0.74, רווח בר-סמך של 95%, 0.7-0.78) גבוהים יותר בהשוואה למעריך אנושי [p<0.05 עבור כולם]. גם האלגוריתם של AI וגם רדיולוגים אנושיים הדגימו תפקוד מיטבי עבור נשים עם צפיפות שד נמוכה, CDR ורגישות היו גבוהים יותר עבור הרדיולוגים בבדיקות שד שהוגדרו עם צפיפות הטרוגנית (p=0.059). עם זאת, הסגוליות, PPV ושיעורי כיסוי העדיפו, בעקביות, הערכות מבוססות AI בכלל קטגוריות צפיפות השד, כולל בקבוצה עם צפיפות שד גבוהה מאוד.
מסקנת החוקרים הייתה כי תוכנות מבוססות AI הדגימו רגישות מעט נמוכה בהשוואה למעריך אנושי, אך ההבדל לא היה מובהק סטטיסטית. עם זאת, תוכנות אלו תפקדו טוב יותר מרדיולוגים מבחינת שיעור כיסוי, סגוליות, PPV ו-AUC עם הבדלים משמעותיים יותר עבור נשים צפיפות שד גבוהה.
מקור: