一個做近紅外的化學(xué)計量學(xué)人——訪南開大學(xué)教授邵學(xué)廣
上海長肯設(shè)備供
近年來,我國近紅外光譜分析技術(shù)無論在基礎(chǔ)研究還是應(yīng)用方面都取得了長足進展。而且在近紅外光譜分析技術(shù)研究的龐大人群中,總是能看到國內(nèi)為數(shù)不多的化學(xué)計量學(xué)人身影。其中,南開大學(xué)教授、國內(nèi)近紅外光譜分會副理事長邵學(xué)廣就是其中之一。
南開大學(xué)教授 邵學(xué)廣
日前,儀器信息網(wǎng)編輯采訪了邵學(xué)廣,請他介紹了他走進化學(xué)計量學(xué)、走進近紅外的歷程,并發(fā)表了他對化學(xué)計量學(xué)和近紅外發(fā)展趨勢、以及限制近外應(yīng)用推廣難點等問題的看法,后也談到了如今熱點的近紅外大數(shù)據(jù)的發(fā)展前景。
走進化學(xué)計量學(xué),扎根化學(xué)計量學(xué)
說起來,邵學(xué)廣并不是學(xué)化學(xué)計量學(xué)專業(yè)出身。在讀博士之前他學(xué)的是稀土化學(xué)應(yīng)用專業(yè),1992年博士畢業(yè)后選擇了”小波變換”為未來研究方向,從此才進入了化學(xué)計量學(xué)領(lǐng)域。邵學(xué)廣經(jīng)常和學(xué)生們說起這段經(jīng)歷,一開始很艱苦,*是照著書和手冊自學(xué)。曾經(jīng)有兩篇有關(guān)小波變換的文獻,邵學(xué)廣每年都要看幾遍,據(jù)他自己說,一直到5年后他自己寫《化學(xué)信息學(xué)》一書的時候才真正讀懂了這兩篇文獻。
當(dāng)時邵學(xué)廣決定寫《化學(xué)信息學(xué)》*是因為要開課卻沒現(xiàn)成的教材,沒想到這本書成為了國內(nèi)一本關(guān)于化學(xué)信息學(xué)的書,目前已經(jīng)出版3版。
為什么從小波變換開始,邵學(xué)廣說到,“關(guān)于小波變換,1986年上其他領(lǐng)域已經(jīng)有人開始使用,化學(xué)領(lǐng)域真正的一篇文章發(fā)表在1992年。而1992年我正好剛剛參加工作需要尋找并確定今后的研究方向。那么,當(dāng)時我覺得新提出來的小波變換會是一個很好的方向。”剛開始的5年多時間里其團隊一直在做方法,并在各種光譜、色譜方面廣泛嘗試,結(jié)果證明這個方法的效果特別好,更加增強了邵學(xué)廣的信心,從而這項工作邵學(xué)廣一直堅持到現(xiàn)在。
除了小波變換,邵學(xué)廣這些年主要研究工作包括免疫算法、化學(xué)因子分析、人工神經(jīng)網(wǎng)絡(luò)、遺傳算法等算法,還包括分子模擬等理論化學(xué)計算方法研究。
“其實,我們實驗室做的有特色的是免疫算法,是我們的一種算法。”免疫算法主要用于色譜重疊組分信號解析,可以把單峰解出來。原來色譜分析10-20個成分的時候,需要用時30-40分鐘。而用了免疫算法只需10多分鐘進行分離,分離結(jié)束即直接就能夠計算出來。如,40多個組分的農(nóng)殘分析只需10多分鐘。
結(jié)緣近紅外,思考近紅外
近紅外光譜的缺點之一是解釋性差,峰很寬、很模糊。在計量學(xué)出現(xiàn)之前,近紅外光譜一直沒有得到很好的發(fā)展。“近紅外和化學(xué)計量學(xué)是捆綁在一起的兩種技術(shù),可以說計量學(xué)的發(fā)展推動了近紅外的發(fā)展;同樣也可以說近紅外給了化學(xué)計量學(xué)一個舞臺,讓它有了發(fā)揮作用的地方。”
近年來,近紅外光譜發(fā)展很快,而邵學(xué)廣在近紅外領(lǐng)域也已經(jīng)做了將近20年。這期間他們嘗試了不同的建模方法,也提出了自己的方法,同時還研究了另一個非常重要的問題,即建模樣品的確定問題,發(fā)表了幾十篇的論文。“近紅外相關(guān)化學(xué)計量學(xué)方法的研究已經(jīng)比較充分、成熟。盡管不能說哪種方法妥當(dāng),但是有很多方法已經(jīng)能夠用了,想干什么事,基本上都可以做了。當(dāng)然,更‘新鮮’的方法研究也是需要的,但是沒有那么緊迫了。”
關(guān)于近紅外數(shù)據(jù)處理的發(fā)展趨勢,邵學(xué)廣認為,根據(jù)具體的行業(yè)需求進行開發(fā),不做大而全的軟件。如,我們之前與中檢院合作開發(fā)的判別藥品一致性的軟件已經(jīng)交付,得到的反饋還不錯。另外,基于數(shù)據(jù)庫的一些算法要實現(xiàn)標(biāo)準(zhǔn)化。邵學(xué)廣認為,近紅外數(shù)據(jù)處理的下一步方向是高光譜,因為如今的近紅外光譜成像數(shù)據(jù)處理還有不太成熟的地方。
關(guān)于近外光譜分析技術(shù)應(yīng)用與推廣的難點,是邵學(xué)廣常常思考的問題。首先,他提到的是“靈敏度”的局限。近紅外方法靈敏度很低,很多微量成分不好分析,這是限制近紅外光譜在科研領(lǐng)域應(yīng)用推廣的很大一個原因。怎么讓近紅外能測微量成分,邵學(xué)廣已經(jīng)研究7年多的時間了。邵學(xué)廣承擔(dān)基金委的一個重點項目就是研究這個問題,經(jīng)過攻關(guān)2016年時檢測限已經(jīng)達到微克級別。近紅外另一個缺點是結(jié)構(gòu)分析能力差,在表征化合物結(jié)構(gòu)方面遠遠弱于質(zhì)譜或中紅外光譜。這幾年,邵學(xué)廣從做水的光譜入手,花了很大力氣力圖從復(fù)雜的水結(jié)構(gòu)中把不同結(jié)構(gòu)的水分子光譜提取出來。水中水分子結(jié)構(gòu)非常復(fù)雜,有單獨的水分子、二個水分子結(jié)合、三個水分子結(jié)合、甚至更多。“希望大學(xué)、研究所更多人員加入到這方面的研究中來。”
近紅外光譜推廣應(yīng)用更多的限制來自于儀器之間的差異、測量之間的差異。邵學(xué)廣這兩年做了很多模型轉(zhuǎn)移方面的研究工作,他認為儀器之間的差異基本上可以校正,不是太難。因為儀器之間差異是固定的,理論上也是可以校正的。邵學(xué)廣指出,真正難點在于測量之間的差異,如,樣品擺放位置、顆粒度大小等形態(tài)差異帶來的光譜變化會導(dǎo)致測量結(jié)果變化,且理論上就沒有解決方法,只能根據(jù)假設(shè)或一定的近似來修正。邵學(xué)廣基于假定光譜和操作條件之間存在著某些我們不知道的關(guān)系,從而建立相應(yīng)校正模型把這種關(guān)系預(yù)測出來。“這個校正模型使用的效果挺好,但是還缺少相應(yīng)的理論依據(jù)。”
推應(yīng)用發(fā)展,落地人才培養(yǎng)
邵學(xué)廣強調(diào),“化學(xué)計量學(xué)專業(yè)人才的缺乏是近紅外應(yīng)用發(fā)展的主要難點。”從事化學(xué)計量學(xué)相關(guān)專業(yè)研究的人員較少,而且,化學(xué)計量學(xué)不是本科階段必須學(xué)習(xí)的內(nèi)容,研究生階段開課的也不多。歐洲大學(xué)本科階段已經(jīng)在教學(xué)大綱中規(guī)定化學(xué)計量學(xué)為必學(xué)內(nèi)容,其份量已經(jīng)占到分析化學(xué)內(nèi)容的四分之一。但在國內(nèi)還沒有這個要求。“這導(dǎo)致培養(yǎng)的相關(guān)人才太少,對化學(xué)計量學(xué)和近紅外的發(fā)展限制相當(dāng)大。”
很多人提到化學(xué)計量學(xué),會莫名的感覺有點“怕怕”。事實上,現(xiàn)在研究化學(xué)計量學(xué)的人雖然不算多,但是也很容易找到合作的人。另外,如今也有一些比較成熟的軟件,即使不懂化學(xué)計量學(xué)原理,只要會用軟件,也能解決問題。
現(xiàn)在,邵學(xué)廣在南開大學(xué)本科階段開設(shè)了計量學(xué)相關(guān)教學(xué)內(nèi)容。而且,經(jīng)常有外面學(xué)生來邵學(xué)廣實驗室學(xué)習(xí),或者以項目合作的模式聯(lián)合培養(yǎng),時間不等,邵學(xué)廣負責(zé)指導(dǎo)。再者,這幾年邵學(xué)廣的實驗室也開發(fā)出了一些軟件。像是具有使用便利等優(yōu)點的小波變換算法,不但成為了邵學(xué)廣實驗室扣背景的標(biāo)準(zhǔn)方法,而且,邵學(xué)廣表示,對于小波變換,內(nèi)行人可以靈活設(shè)置參數(shù),外行人不調(diào)整參數(shù)也能使用。所有這些都是邵學(xué)廣在為實現(xiàn)“不應(yīng)該讓不懂計量學(xué)成為計量學(xué)和近紅外應(yīng)用的障礙”所做的努力。
由此延伸,邵學(xué)廣談到了近紅外的人才培養(yǎng)問題,并強調(diào)“打好地基”的重要性。近紅外研究人員不要只盯住應(yīng)用去做,一方面要針對應(yīng)用,但又不能*是應(yīng)用。特別是對年輕研究人員,要把基本理論“打”扎實了,等到去做應(yīng)用的時候,應(yīng)用方法、技術(shù)會非常穩(wěn)固和牢靠。否則,很多技術(shù)不牢靠反而會導(dǎo)致應(yīng)用失敗。而且,糟糕的是,一旦失敗,大家就會認為這個方法不好,實際上會阻礙了這個領(lǐng)域的發(fā)展。
大數(shù)據(jù)推動近紅外爆炸式增長
如今“大數(shù)據(jù)”已經(jīng)成為一個熱詞,邵學(xué)廣也在多個場合說到,近紅外的大數(shù)據(jù)時代已經(jīng)來臨。“與其他大數(shù)據(jù)相比,近紅外光譜大數(shù)據(jù)有兩個特點:數(shù)據(jù)量大、信息量大。”特別是成像光譜和高光譜,高光譜儀器的檢測器和目前儀器所用的有所差異;而且常用的模型轉(zhuǎn)移、數(shù)據(jù)處理等和原來傳統(tǒng)光譜也有一些差別,所以,必須開發(fā)一些新的據(jù)分析方法。邵學(xué)廣介紹到,“原來只是1-2000個數(shù)據(jù)點,現(xiàn)在一個高光譜數(shù)據(jù)量上萬,可變量選擇的方法范圍很小。”
此外,一條光譜所含信息豐富,除了化學(xué)信息,還包括物理信息,如硬度、大小、位置等,需要綜合利用。在藥品的真假判別時,往往是隔著包裝測試的,包裝材料的信息、藥片壓的實不實、藥片的形狀等物理信息都可以判別。“我們近紅外不管是哪種信息,只要有這方面的信息,不用刻刻意強調(diào)是物理還是化學(xué)信息。”
“從應(yīng)用角度看,近紅外大數(shù)據(jù)的價值,目前在于監(jiān)控。”監(jiān)控包括工業(yè)監(jiān)控,甚至應(yīng)用到“大街上”的空氣質(zhì)量等監(jiān)控。“大數(shù)據(jù)來源于實時,也來源于長期實時數(shù)據(jù)的積累。對大數(shù)據(jù)進行相關(guān)分析、可視化分析,把數(shù)據(jù)和事件相關(guān)并從中總結(jié)出其規(guī)律性,比如說大型活動的人流等。數(shù)據(jù)更多的時候就可以根據(jù)已有數(shù)據(jù)建立模型,根據(jù)光譜信息預(yù)測后續(xù)發(fā)展。”
“目前大數(shù)據(jù)研究還處于初級階段,炒概念的多些,但各行各業(yè)都在用。”如,已有按大數(shù)據(jù)系統(tǒng)設(shè)計的藥品數(shù)據(jù)庫,把全國藥監(jiān)的數(shù)據(jù)集成在一個數(shù)據(jù)庫中。在這個庫的基礎(chǔ)上建立模型,可用于市場調(diào)查、藥品抽檢等。“只需做一個光譜,上傳到數(shù)據(jù)庫,數(shù)據(jù)庫就可根據(jù)模型判別藥品的真假,并把結(jié)果反饋回移動終端。目前該數(shù)據(jù)庫建設(shè)基本完成,相關(guān)技術(shù)均已成熟。”糧食領(lǐng)域也啟動了類似項目,雖不涉及網(wǎng)絡(luò)、無線通信,但也涉及數(shù)據(jù)庫建設(shè)??奢斎胧召徏Z食樣品的光譜來得到樣品相關(guān)的濕度、蛋白質(zhì)含量等各項參數(shù)。煙草行業(yè)的原料大數(shù)據(jù)系統(tǒng)、生產(chǎn)在線監(jiān)控也已經(jīng)做好。
“類似工作在許多行業(yè)都已經(jīng)開展,但是真正投入使用的不多。”邵學(xué)廣這樣說到,“這些大數(shù)據(jù)系統(tǒng)的實際應(yīng)用,不光是技術(shù)的問題,在于監(jiān)管或被監(jiān)管者是否想做。”
不過,邵學(xué)廣也指出,大數(shù)據(jù)的發(fā)展需要由應(yīng)用需求驅(qū)動。像現(xiàn)在的物流、快遞行業(yè),需求太大了。而實驗室對儀器中的大數(shù)據(jù)應(yīng)用現(xiàn)在需求不強烈。但我們這些做研究工作的學(xué)者可提前做好方法。就過程分析而言,下一步一旦國內(nèi)產(chǎn)品質(zhì)量從產(chǎn)品檢驗控制轉(zhuǎn)向過程控制,從政府層面推廣過程控制,到那個時候,企業(yè)自然會來找,近紅外光譜會有一個爆炸式增長。