當前位置:熒颯光學儀器(上海)有限公司>>技術文章>>紅外應用|聊聊光譜相關性
紅外應用|聊聊光譜相關性
作為紅外光譜QC人員,在日常工作中最常用的一項任務就是確認所采集的樣本紅外光譜是否和標準樣本一致,或者在對未知物進行確認時,需要從海量的標準光譜庫中尋找到最佳匹配的樣本,這個時候往往就需要一個方法來評判。
這個方法我們通常使用光譜“相關系數(shù)”或者“匹配系數(shù)”,也有稱之為“HQI”(相似度指標)來衡量。這里有兩個核心問題:(1)兩張光譜“相關性”怎么計算?(2)“相關性”達到多少算好?
圖1是熒颯光學公司S-IR軟件中未知樣本光譜在光譜庫中進行檢索的示例,根據(jù) “相關系數(shù)”計算,軟件給出了最為匹配的可能物質是聚苯乙烯,其相關系數(shù)達到88.98%。
圖1 譜庫檢索
下面我們簡單聊聊這個過程,看看有沒有豁然開朗的感覺。
如圖2,有一個未知樣本光譜和兩張標準樣本光譜,假設每張光譜只由三個波長點組成,分別是未知樣本[1, 2, 3],標樣1[1.2, 2.1, 2.8]和標樣2[2, 2.5, 1.8],將其繪制在3D坐標系中,肉眼可見,未知樣本和標樣1靠的很近,和標樣2相隔很遠。我們就可以輕而易舉地給出判斷和結論。但當光譜從3個波長點擴展到N個點(比如4000-400cm-1)時,這時候人腦和肉眼就根本不夠用了,只能借助算法來計算,并給出判斷結果。
圖2
兩張光譜之間的相關系數(shù)用于衡量它們之間的相關程度,常用的方法是皮爾遜相關系數(shù)(Pearson correlation coefficient),在光譜分析中,即兩張光譜對應波長處的強度值之間的線性關系。通常其取值范圍在[-1,1]之間:
-
值為 1 表示完全正相關,即兩張光譜的變化趨勢完全一致。
-
值為 -1 表示完全負相關,即兩張光譜的變化趨勢完全相反。
-
值為 0 表示不存在線性相關關系。
為了便于理解,我們通常取絕對值來表達其相關性強度。
假設有兩張光譜,分別為 X=[x1,x2,...,xn] 和 Y=[y1,y2,...,yn],它們的皮爾遜相關系數(shù)的計算公式為:
是不是有點眼熟?妥妥的就是平常使用的最小二乘法嘛。恭喜你答對了!
我們將圖2中的未知樣本和兩個標樣計算一下,相關系數(shù)分別0.99和0.27,所以也驗證了我們肉眼的準確性。除了皮爾遜相關系數(shù)之外,還有其他很多類似的算法,比如歐式距離法、馬氏距離法、夾角余弦距離法等等,匹配值在有些軟件中也就會變成最大到999。不一而論,主要思想都差不多。
下面關于第二個問題,則比較主觀了,需要根據(jù)自己實驗室要求來做確定。小編在此給一個參考,在制藥領域中,通常將最小HQI設置為0.95,以此來判定未知樣品與標準圖譜是否匹配。
?