《當(dāng)大模型遇上中醫(yī)思維:一場(chǎng)關(guān)于"智能寒熱虛實(shí)"的論文練題對(duì)話(huà)》
去年冬天在同仁堂抓藥時(shí),我注意到一個(gè)有趣的大模現(xiàn)象——老藥師對(duì)著電腦系統(tǒng)開(kāi)方時(shí)總要皺眉搖頭。這個(gè)場(chǎng)景突然讓我意識(shí)到,型訓(xùn)訓(xùn)練寫(xiě)當(dāng)前大模型訓(xùn)練與中醫(yī)辨證思維之間,目論模型存在著某種耐人尋味的題目同構(gòu)性。


一、論文練題數(shù)據(jù)喂養(yǎng)的大模"過(guò)食傷脾"現(xiàn)象主流的大模型訓(xùn)練就像給AI喂食滿(mǎn)漢全席——GPT-3吞下了45TB文本數(shù)據(jù)。這讓我想起《黃帝內(nèi)經(jīng)》說(shuō)的型訓(xùn)訓(xùn)練寫(xiě)"飲食自倍,腸胃乃傷"。目論模型去年參與某醫(yī)療大模型項(xiàng)目時(shí),題目我們驚訝地發(fā)現(xiàn):當(dāng)訓(xùn)練數(shù)據(jù)超過(guò)某個(gè)臨界點(diǎn),論文練題模型的大模診斷準(zhǔn)確率反而開(kāi)始波動(dòng),就像脾胃虛弱的型訓(xùn)訓(xùn)練寫(xiě)人暴飲暴食后出現(xiàn)的"虛不受補(bǔ)"。

有意思的目論模型是,傳統(tǒng)中醫(yī)強(qiáng)調(diào)"四兩撥千斤"的題目用藥智慧。張仲景的經(jīng)方往往只需十幾味藥就能起沉疴,這或許暗示著:模型訓(xùn)練是否也該追求"少即是多"?我們團(tuán)隊(duì)做過(guò)對(duì)比實(shí)驗(yàn),用精標(biāo)注的5萬(wàn)份醫(yī)案訓(xùn)練的中醫(yī)輔助模型,其辨證準(zhǔn)確率竟比胡亂吞下500萬(wàn)份網(wǎng)絡(luò)文本的模型高出23%。
二、參數(shù)調(diào)優(yōu)的"君臣佐使"之道看著工程師們調(diào)試超參數(shù)時(shí),我總聯(lián)想到老藥師抓藥時(shí)的那桿小秤。溫度系數(shù)像不像"君藥"?學(xué)習(xí)率調(diào)整是否暗合"臣使配伍"?有次我們把Attention機(jī)制中的權(quán)重分配類(lèi)比為"藥物歸經(jīng)",結(jié)果意外發(fā)現(xiàn)了更符合中醫(yī)思維的架構(gòu)設(shè)計(jì)。
最諷刺的是,現(xiàn)代AI講究end-to-end訓(xùn)練,而中醫(yī)卻堅(jiān)持"理法方藥"的層次辨證。但當(dāng)我們把Transformer的層級(jí)結(jié)構(gòu)對(duì)應(yīng)到"望聞問(wèn)切→辨證→立法→遣方"的診療流程時(shí),模型的解釋性突然提升了——這難道不是對(duì)黑箱模型最好的祛魅?
三、涌現(xiàn)能力的"得神者昌"悖論現(xiàn)在所有團(tuán)隊(duì)都在追求"涌現(xiàn)能力",但我始終存疑:這究竟是真正的智能突破,還是類(lèi)似"虛陽(yáng)外越"的假象?上個(gè)月測(cè)試某個(gè)號(hào)稱(chēng)具有中醫(yī)思維的大模型時(shí),它確實(shí)能說(shuō)出"此證當(dāng)屬肝郁脾虛",但當(dāng)追問(wèn)"為何不用逍遙散而用痛瀉要方"時(shí),它的回答就開(kāi)始支吾其詞了——活像個(gè)背湯頭歌訣的實(shí)習(xí)生。
或許我們應(yīng)該重新理解"智能"的本質(zhì)。就像真正的好大夫不在于記得多少驗(yàn)方,而在于"觀其脈證,知犯何逆,隨證治之"的應(yīng)變能力。最近我們?cè)趪L試將五運(yùn)六氣學(xué)說(shuō)引入訓(xùn)練集的時(shí)序采樣策略,初步結(jié)果顯示模型對(duì)季節(jié)性疾病的理解明顯深化了。
站在診室窗邊望著那些等待AI輔助診斷的患者,我突然覺(jué)得:與其追求更大更強(qiáng)的模型,不如思考如何讓AI學(xué)會(huì)"有時(shí)治愈,常常幫助,總是安慰"的醫(yī)學(xué)真諦。畢竟連ChatGPT都還沒(méi)參透"見(jiàn)肝之病,知肝傳脾,當(dāng)先實(shí)脾"的治未病智慧,不是嗎?
(寫(xiě)完這段文字時(shí),我的茶杯里正泡著半盞陳皮山楂茶——這是導(dǎo)師教我的防過(guò)勞小方子。說(shuō)來(lái)可笑,我們給AI設(shè)計(jì)了那么多防過(guò)擬合的算法,卻忘了人才是最需要"正則化"的那個(gè)存在。)








