摘要
隨著計算機硬件的突破和軟件工程的進步,人工智能在包括醫學領域的多個領域產生了深遠影響。在男科實驗研究領域,已有研究嘗試利用人工智能模型進行精子質量檢測,包括精液常規、精子形態和精子DNA完整性等。此外,人工智能也開始在其他男科檢測領域,如病理學、影像學和遺傳學檢測中發揮作用。本文旨在對人工智能在男科實驗診斷方面的研究進展進行綜述,探討當前人工智能檢測的不足和開發中所面臨的瓶頸問題,為未來人工智能在男科診療體系中的進一步應用提供參考。
【關鍵詞】人工智能;男科;臨床檢驗;深度學習
DOI:10.3760/cma.j.cn101441-20241030-00393
不孕不育困擾著我國約18%的備孕家庭,男性原因佔比50%左右[1]。通常男性不育患者會在門診進行體格檢查,在男科實驗室進行精子質量分析,後續按需進行一些病理、影像、遺傳檢查。這些檢測目前還有很多基於檢驗或影像技師的人工操作與判讀。由於檢測方法學的差異、檢測耗材、試劑以及人員之間的差異,大多數男科檢查仍然存在主觀性強、標準混亂難以統一的現象。
人工智能(artificial intelligence, AI)在過去20年里發展迅速,機器學習、深度學習和人工神經網絡(artificial neural network,ANN)等AI應用從各個方面為醫學賦能,涉及的領域也覆蓋廣泛,例如腫瘤診療、基因診斷、藥物研發等[2-4],男科實驗室的檢測也從中受益。本文從AI在醫學檢驗的應用切入,深入探討AI在男科實驗檢測中的應用進展,展望目前AI在男科實驗檢測的應用局限性與前景。
一 AI的發展為醫學檢驗賦能
早在20世紀50年代,圖靈便提出了借助計算機模擬智能行為的理念[5]。隨後在達特茅斯會議上,麥卡錫首次提出了AI這個概念,紐厄爾和西蒙則展示了編寫的邏輯理論機器。此後於上世紀80年代,多層神經網絡的學習機制被提出,並逐漸具有了可以自動調節神經元連接的權重[6]。此後的幾十年,這方面一系列的成果使得深度學習成為了AI的主流技術。AI領域在經歷數十年的飛速發展後,目前的AI主要由3個要素組成,即算法、算力以及數據[7]。機器學習是AI算法領域中一個主要分支,它通過從數據中自動學習規律,使計算機能夠在無須顯式編程的情況下執行任務和做出決策。機器學習算法的性能高度依賴數據表示,即從複雜、噪聲較多的原始數據中提取出能夠突出核心信息的特徵,以便算法更好地學習數據規律。然而,傳統特徵提取依賴人為經驗,往往難以適應數據的多樣性和複雜性[8]。深度學習是在機器學習模型ANN的基礎上發展而來的,三者是層層遞進的關係(圖1)。深度學習旨在構建更深層次的多層神經網絡從而自動學習大規模數據中的規律,無須依賴人工特徵工程。以圖像處理為例,每一層網絡可以提取不同層次的圖像信息,從低級邊緣、紋理到高級抽象特徵,逐層加深對圖像內容的理解。
AI技術在臨床醫學的多個領域已展現出顯著的應用價值,特別是在醫學影像、病理圖像和內窺鏡圖像的分析中,通過提供精准的輔助信息,支持醫生進行更快速、全面的疾病篩查、診斷和治療決策。在醫學影像分析中,AI可以自動處理各類影像數據,提取疾病特徵並提供輔助分析。例如,在腦部影像中,AI能幫助分析核磁共振成像和計算機斷層掃描數據,支持腦腫瘤、腦卒中和神經退行性疾病的檢測[9];在眼科領域,AI可在視網膜圖像中檢測糖尿病視網膜病變、黃斑變性和青光眼,為早期診斷提供支持[10]。在病理圖像分析中,AI能識別數字病理切片中的癌細胞和異常組織,輔助腫瘤分級和分期,還可將不同色調的蘇木精-伊紅染色圖像向特定顏色風格轉換,從而實現圖像標準化[11]。而在內窺鏡圖像分析中,AI主要用於胃腸道疾病的實時檢測與輔助診斷。AI能自動識別胃腸鏡、結腸鏡等內窺鏡圖像中的息肉,幫助醫生提升篩查的敏感度[12]。此外,AI可以優化內窺鏡圖像的質量,使病灶更加清晰可見,尤其在複雜病變或模糊圖像中,輔助醫生更加準確地觀察病變區域[13]。
二 AI在精子質量分析中的應用
1.精液常規檢測:精液常規分析作為男性生殖健康評估的核心手段,其歷史悠久,顯微鏡下對精子濃度、活力分析是評估精子質量的直接且可靠的方法。儘管在最新一版的《世界衛生組織人類精液檢查與處理實驗手冊》中仍然是以人工判斷精液常規為主[14],但是其客觀性不足、重復性差的缺點讓各實驗室的報告仍然無法很好地互通。計算機輔助精液分析系統(computer-aided semen analysis, CASA)技術有效地彌補了人工檢測的局限性,並被廣泛應用於臨床。最近一項中國地區的研究中,73.6%的男科實驗室都採用了CASA[15]。但是傳統的CASA仍有一些缺陷,如出現漏抓、抓錯、無法區分粘連精子等[16]。
CASA的基本思路分為精子檢測和精子追蹤兩部分,前者從精子和噪聲中識別出精子並完成定位,後者對檢測出的精子進行追蹤,記錄精子的運動軌跡。AI深度學習技術目前較多用於CASA中的精子檢測功能部分,效果較好,但是針對精子追蹤功能所建立的AI模型較少,原因是深度學習模型計算量較大,如果視頻中運動的精子過多,逐一追蹤和匹配計算量極大。此外,深度學習需要的數據較大,而應用於追蹤時需要人工對視頻所有幀內的精子進行標注和匹配,標注的工作量過高。儘管如此,AI在精子追蹤方面的應用潛力仍不容小覷。Thambawita等[17]構建了一個精子運動視頻的數據集該數據集包含29 196張圖片與20段視頻,每個視頻的固定持續時間為 30 s,其中帶有由專家分析注釋的邊界框坐標與精子特徵,與其他數據集不同,該數據集的運動追蹤功能有助於在視頻中識別精子,從而產生更詳盡的數據。通過對該數據集的深度學習,AI模型展示了良好的精子抓取性能。除此之外,數據集文件中還包含了患者的其他信息,如精液質量參數、血清性激素水平、脂肪酸水平等等,為其他方向研究提供基礎。Alameri等[18]採用了一種改進的高斯混合模型進行精子活力追蹤,對10個不同的樣品進行測試,其準確度、靈敏度和特異度分別為92.3%、96.3%和72.4%。追蹤精子軌跡的一大技術難題是如何準確區分距離很近(或交叉)的精子,此前已有CASA系統使用最近鄰或全局最近鄰算法將不同時間點的精子位置關聯起來,形成每個精子的軌跡,但是容易出現錯聯[19]。之後有研究開發了一種聯合概率數據關聯過濾器方法,使用當前測量來列舉所有可能的關聯,並計算關聯概率,以有效區分精子,並獲得了更高的追蹤精度[20]。傳統的CASA通過捕捉精子頭部測量精子的運動參數,另有一項研究開發了自動追蹤鞭毛運動軌跡的系統[21]。如今基於AI的CASA已經愈發得到關注與開發,形成了一系列成熟的商業化產品[22-23]。由於精子是在一個三維空間中運動,但是臨床檢測往往將其局限於一定厚度的計數池中,因此無法很好地還原精子鞭毛螺旋狀的擺動,有研究者使用薄透鏡近似法和高速暗場顯微鏡開發了一種圖像重建算法在三維中重建鞭毛波形,用於分析精子的游動,但這目前還停留在科研階段,離商用還有距離[24]。
在患者對隱私保護和醫療便捷性需求不斷增加的背景下,加之光學、計算機和通信技術的飛速發展,即時檢驗(point-of-care testing,POCT)技術得到了快速的發展[25]。近年來研究者們開始關注將POCT應用於精液分析領域,尤其是希望使用智能手機檢測精子質量的呼聲日益增高。這要求精子分析設備從傳統的透鏡顯微鏡轉向無透鏡技術,從而實現小型化。這一技術基於的是高性能光源技術、成像芯片以及計算能力的大幅提升,而這與AI的發展也密不可分。有研究者通過大視場分析結合AI算法抓取精子,開發了基於智能手機的精子分析系統,小巧便捷並且可以以小於5 s的平均處理時間分析未清洗、未處理的液化精液樣本,其精液質量評估的準確率可達98%[26]。除此之外,還有很多國家的研究者開發了基於智能手機的精液分析系統,並分別與傳統的人工計數與CASA進行了結果的比對,發現無論是精子濃度還是活力,三種檢測的結果均顯著相關,提示著智能手機精液分析系統的巨大潛力[27-28]。目前國外已經有相關產品獲得美國食品藥品監督管理局批准並進入消費市場[28],國內也出現了相關的產品並投入臨床進行測試。
2.精子形態分析:精子形態分析是另一項評估男性生育力的基礎檢測技術,臨床分析人員通過顯微鏡觀察染色處理後的精子標本,按照世界衛生組織(World Health Organization,WHO)制定判讀標準評估精子頭部、頸部以及尾部形態,統計正常精子比例,以評估精子的受精能力[14]。然而,不同人員精子形態分析結果的一致性較低,研究顯示變異系數可達4.80%~132.97%[29]。這使得精子形態學分析的臨床價值一直存在爭議,近年來甚至有學者開始質疑WHO制定的精子形態判讀標準[30]。
研究顯示,未嚴格遵守WHO操作標準和人工分析的主觀性是導致精子形態分析最大的誤差來源[31]。這使得計算機輔助精子形態分析系統(computer-aided sperm morphometric assessment,CASMA)的需求愈發高漲。與精子常規分析類似,早期的CASMA搭載的AI模型也多由圖像預處理、圖像分割、特徵提取、機器學習分類算法等組成。不同點在於CASMA中的特徵提取算法更擅長描述精子的形態,常用的特徵包括面積、長度、寬度、長寬比、對稱度、灰度共生矩陣、傅里葉描述符等[32]。Chang等[33]提出了一個兩階段分類方案,精子頭部分為5個不同的類別,並結合了特徵選擇的集合策略和級聯方法進行分析,該系統能夠提供73%的平均分類準確率,作者將不理想的準確率歸因於不同精子頭部的分類難以真正確定,再加上專家之間的形態判讀高度差異性。Tseng等[34]通過支持向量機分類算法從精子輪廓中提取一維特徵和灰度信息並分割成數字向量,經過數據疊加與方法改良,將判讀的精確度從76.875%提高到了87.5%。
基於深度學習的AI模型省略了繁瑣的特徵設計和提取工作,可通過大規模訓練使模型自主學習用於區分不同種類圖像的高貢獻特徵,即使是基礎模型的識別準確率,也往往可以輕鬆超過精心設計的形態學特徵分析,例如 VGG16對HuSHeM數據集中的錐形、梨形、不定形、小頭識別準確率達到94%在SCIAN-MorphoSpermGS 數據集上的平均召回率為62%[35-36],InceptionV3數據集能達到87.3%,但是平均訓練處理時長長達4.4 h[37],其他一些未作明顯改進的模型,準確率也在85%以上[38]。隨著深度學習的不斷發展,各種新方法被不斷引入。Jabbari和Bigdel[39]結合生成式對抗網絡與膠囊神經網絡,合成精子圖像以解決數據不平衡的問題,最終達到了 97.8%的準確率。Sapkota等[40]提出的SHMC-Net含有精子分割和分類兩個任務,二者在各尺度下的特徵被不斷融合,準確率達到98.2%,精確度達到98.3%,召回率即靈敏度達到98.1%。但是需要認識到的是,儘管精子形態識別判讀的算法準確率在不斷提升,目前仍沒有應用於臨床,仍沒有很好的CASMA隨之產生。所有以上的模型都處於開發實驗階段,後續的轉化任重道遠。
另有研究顯示,在採用不同的染色試劑時,人類精液的滲透壓與試劑滲透壓的差異可能會引起精子頭部形態發生變化,致使制備的精子圖像存在異質性[41]。針對該問題,有研究提出精子多目標交錯運動場景的實時追蹤算法[42],可對未經染色的多精子交錯運動目標進行精准地追蹤,並通過AI完成精子頭部、頸部和尾部的形態分析、精子活力分析及精液濃度分析,未染色的活精子形態分析可以很好地在輔助生殖中用於形態優良的活精子的挑選。然而目前對未染色的精子形態尚無公認的評判標準。為瞭解決這一問題,有研究引入了基於色彩遷移的虛擬染色技術[43]。該技術通過AI對成對的數據集(同一個精子染色與未染色對應的圖片)進行深度學習,使收集的非染色圖像擁有染色的效果。Nygate等[44]還提出了一種稱為HoloStain的色彩遷移方法,在對228個精子的全息圖像觀測分析中,虛擬染色和化學染色圖像之間的總誤差為0.156 6±0.044 6。然而這些設備體積龐大且昂貴,距離大規模臨床應用還有距離。還有研究者直接摒棄顯微鏡,提出了一種將深度學習與基於圖像的高通量流式細胞術相結合的新方法,在20、40和60倍放大倍率下,形態學分類的準確性可達96.73%、98.55%和99.31%[45]。
在精液樣本中,除了精子外,還含有眾多脫落細胞,包括來自睪丸的各種生精細胞、不同類型的上皮細胞以及血液細胞等。這些脫落細胞通常會被認為是“圓細胞”。然而各種脫落細胞的出現有不同臨床意義,因此對脫落細胞的染色觀察對於不育患者尤其是嚴重少精子症或無精子症患者十分重要[46]。然而,脫落細胞學檢測對檢驗人員的專業技能有較高的要求。AI技術的應用對該領域非常有價值。截至目前,尚未有關於精液脫落細胞學的AI判斷模型被廣泛報道。但是在其他領域,如腫瘤學中,有研究者構建了一個由類器官衍生的癌症和具有不同形態的正常細胞的顯微圖像組成的數據集,並開發了一個深度學習模型,可以在未標記的顯微鏡圖像中區分癌細胞和正常細胞[47],這類模型的成功給AI用於脫落細胞學檢查奠定基礎。
3.精子DNA碎片檢測:精子由於體積小,遺傳物質需要高度壓縮,導致其DNA所受應力更大,較體細胞DNA更脆弱,容易斷裂產生碎片[48]。目前,精子DNA碎片化指數(DNA fragment index,DFI)是臨床評估男性生育力的常用指標,主要檢測方法是基於吖啶橙染色與流式細胞技術的精子染色體結構分析(sperm chromatin structure assay, SCSA)和基於染色光暈法的精子染色質擴散試驗(sperm chromatin dispersion, SCD)[49-50]。SCD法由於需要塗片、染色以及人工判讀光暈大小評估精子DFI,主觀性較強,干擾因素多,AI對於圖形的學習判讀很適合精子DNA碎片評估。Kuroda等[51]開發了AI判讀SCD塗片的軟件,與現有的SCSA法有顯著的一致性,為缺乏流式細胞分析儀的機構提供了檢測DFI的可靠方法。目前針對精子DNA損傷的AI模型較少,但是在腫瘤領域,利用AI量化DNA損傷的報道已有很多[52-53]。目前還沒有針對SCSA法的AI模型報道,但是有國內團隊將AI圖像識別技術應用於SCSA法染色的精液樣本識讀,判斷染色圖片上不同螢光精子的組成從而計算DFI,檢測結果與流式法具有顯著一致性,且方法的重復性很高,對於一些極端樣本,如精子濃度極低患者的DFI檢測有指導意義[54]。除此之外,對於生殖中心的胚胎師,他們更希望可以不染色直接獲得精子的DFI,因此有研究者在已知DNA質量的約1 000個精子細胞的數據集上訓練AI,通過精子圖形直接預測其DFI,該模型可以以每個細胞少於10 ms的速度快速預測精子DNA質量,並且有86%的置信區間[55]。AI算法一旦標準化,就能利用精子照片評估單個精子的質量,而且不受任何主觀因素的影響,但是這需要建立大規模的精子圖像及其相應DFI的數據集[56-57]。
4.精漿標誌物檢測:傳統的精漿標誌物主要是附屬性腺的分泌物,例如檸檬酸、鋅、果糖、左旋肉鹼、中性-α-葡糖苷酶等,反映的是附屬性腺的分泌功能。依賴於多組學的發展,精漿中與精子質量相關的標誌物被逐漸挖掘,通過AI大模型分析可以很好地篩選這些標誌物。有研究通過ANN關聯了117例患者的精液常規參數與他們的精漿生化指標,包括果糖、鋅和總蛋白含量[58]。與傳統精液分析相比,新發現的生化參數的價值尚不明確,但已確定有一些基於多組學的標誌物,如γH2AX、miR-34c-5p等,可以被視為相關的生物標誌物,它們或許有助於以經濟、簡便和準確的診斷方法確定不孕症的病因和受精預後[59]。也有研究通過轉錄組學分析在精漿中發現一組細胞外囊泡的長非編碼RNA,對於預測非梗阻性無精子症患者顯微取精成功率,其受試者工作特徵曲線的曲線下面積(area under the curve,AUC)為0.986。此外,與基於同組血清激素的模型相比,這些標誌物更有優勢(AUC分別為0.970、0.723)[60]。針對非梗阻性無精子症,多組學的研究在此前已經發現了很多相關的非侵入性生物標誌物,而利用AI將其整合到相關的診斷中,可能會給該領域帶來變革。Tang 等[61]採用了5種不同的機器學習算法,來識別非梗阻性無精子症的潛在生物標誌物併發現IL20RB、 C9orf117、 HILS1、 PAOX和DZIP1等基因與NOA的強相關性。針對一些特殊病症,如精索靜脈曲張,AI可以結合影像學與精漿的生物標誌物,如細胞因子、精漿活性氧等等,實現更精確的診斷[62]。
三 AI在其他男科檢測中的應用
睪丸病理學檢查是對於精子發生很好的一個評估手段。但是由於睪丸的組織特殊性,對於睪丸內各類細胞的區分以及生精時相的判斷是一項十分考驗專業能力與經驗的工作。有部分研究借助AI的圖像識別判斷功能成功在小鼠、狗上實現了睪丸組織的病理學檢查[63-65]。
男科超聲檢查部位涉及前列腺、精囊、輸精管、附睪以及睪丸等,AI的圖像增強功能可以更好地得出可靠清晰的超聲影像,幫助超聲醫師判斷結果。有研究將AI應用於經直腸超聲的前列腺癌診斷、治療和監測,以及對於前列腺體積準確的測量[66]。還有研究者利用睪丸超聲數據與放射組學結合,建立AI模型,發現睪丸超聲紋理特徵結合患者精液參數可以有效預測睪丸生精能力和垂體激素分泌的穩定程度[67]。
遺傳學檢查是目前男科檢查的新熱點,主要包括染色體核型分析、精子非整倍體、Y染色體微缺失以及基因測序等。對於染色體核型分析AI的發展已經相對成熟,目前有相關的軟件被用於臨床[68]。精子非整倍體的檢查基於螢光原位雜交,其圖像也有AI判讀的潛力。針對Y微缺失以及基因測序的研究,無論是全基因組測序還是全外顯子組測序,結果的診斷解釋仍是挑戰。有研究通過AI學習,構建了眾多全自動的基因組解釋模型,以輔助遺傳分析師進行結果的判讀[69-70]。
對於非梗阻性無精子症患者臨床往往嘗試使用顯微取精手術進行治療,顯微取精獲取的睪丸組織在划碎後會交由實驗室尋找精子。對於這部分組織中精子的識別十分考驗實驗室人員的能力,而AI由於能夠實時、高精度地處理低分辨率圖像和未染色精子,使其在這方面有著巨大的潛力。類似的,對於輔助生殖,尤其是卵胞質內單精子注射(intracytoplasmic sperm injection,ICSI),精子的優選同樣是採用人工方法,耗時且主觀。正如我們上述的,AI在精子追蹤方面性能卓越,可以高保真地跟蹤單個精子,為以上檢測打下基礎[71]。Somasundaram等[72]設計了一個算法模型用於結合運動分析和精子跟蹤,該模型在1.12 s內以97%的準確率將單個精子分為高、中和低活力,隨後可以在視頻中跟蹤單個精子。除此之外,Zhang等[73]通過利用計算機視覺算法測量每個精子的活力和形態參數,並檢測對應的精子DNA完整性,建立了一套用於ICSI的精子優選軟件,並在驗證實驗中發現軟件挑選出的精子優於胚胎學家所選,其DNA完整性更高。
四 展望:機遇與挑戰並存
AI的飛速發展是男科實驗診斷發展的重大機遇,隨著算力硬件的更新以及算法的不斷完善,AI正逐步在精子質量分析、男科病理、影像、遺傳等領域發揮重要作用。目前的AI在男科實驗診斷領域主要是通過學習大量不同臨床試驗結果組成的數據集,通過特定的算法完成對應的結果判讀(圖2)。目前許多實驗室雖然通過不同的項目獲取了很多數據,但是臨床醫生並不能通過這些指標很好地評估男性生育力,因此,除了對於實驗室結果的判讀,通過AI建立多因素大數據的男性生育力評估模型刻不容緩[74]。而且目前對於男科檢測AI的開發仍然基於國外的數據集,而其性能也多數採用其餘數據集驗證,缺乏與臨床的妊娠結局進行聯繫並評估其作用,這需要在AI檢測平台廣泛採用後,由各個實驗室人員聯合本中心的妊娠結局數據進行回顧性分析。針對AI算法,其固有的不透明性使得結果的可追溯性及解釋性存在局限。目前廠商比較在意數據的可視化與算法的迭代優化,這需要臨床人員進行及時的使用反饋。對於CASMA的研究,關注精子頭部形態較多,對於鞭毛的關注較少,所幸的是目前國內已有公司和研究機構的產品在不斷迭代中逐漸關注鞭毛的形態。對於目前AI模型的開發,最大的阻力來自數據集的建立,包括硬件和軟件兩個方面。在硬件技術方面,精子細胞體積較小,這要求光學定量成像技術必須達到更高的精確度。然而,這類技術的發展受制於激光光源的穩定性、樣本放置位移台的水平及軸向精度等現有設備的性能。複雜設備的運用,雖能夠提升精度,但價格昂貴且受限較多,這需要光學、材料科學的不斷研發,降低設備成本,改善設備使用環境。在軟件方面,AI模型的準確性依賴於訓練數據集的穩定性,國內仍沒形成很好的臨床數據集。臨床男科實驗室的檢測人員能否產出良好的人工標注數據集,是AI模型得到正確數據的重要因素。這就需要依託國內的權威機構牽頭,構建多中心的數據集採集,建立良好的質量控制體系,首先確保中心之間的數據互認,以達到數據集的穩定。
綜上所述,AI的發展提高了男科實驗室檢測的準確性、一致性與客觀性,減輕了實驗人員的人力與臨床醫生的診斷壓力。AI並不會取代人類在醫療活動中的核心地位,而是作為一種輔助工具,融入現有的診療體系之中。“實驗室檢測+AI輔助+臨床醫生決策”的全方位診療體系的構建能夠提升醫療診療的效率及安全性。AI在男科實驗診斷領域的應用尚處於起步階段,諸多方面尚處於構思層面,尚需男科實驗室人員投身醫工結合研究中,幫助AI成長與開發。從當前發展趨勢來看,AI在男科領域的廣泛應用尚需時日。然而,可以預見,AI技術將在男科實驗診斷中佔據重要地位。