人機(jī)交互的數(shù)據(jù)庫(kù)搭建過(guò)程
截至數(shù)據(jù)庫(kù)發(fā)布當(dāng)天,徐明團(tuán)隊(duì)用7個(gè)月時(shí)間得到了4132個(gè)單元過(guò)程數(shù)據(jù)。“超過(guò)某些國(guó)際知名數(shù)據(jù)庫(kù)10年的數(shù)據(jù)搜集量。”徐明說(shuō)。
效率之所以高,是因?yàn)閳F(tuán)隊(duì)利用國(guó)內(nèi)AI基礎(chǔ)模型,開(kāi)發(fā)了專門適用天工數(shù)據(jù)庫(kù)建設(shè)的大語(yǔ)言模型應(yīng)用工具,在數(shù)據(jù)庫(kù)搭建過(guò)程中實(shí)現(xiàn)人機(jī)交互。
AI提升數(shù)據(jù)檢索效率。徐明團(tuán)隊(duì)成員、清華大學(xué)環(huán)境學(xué)院助理研究員齊劍川以對(duì)二氧化碳的檢索舉例說(shuō):“如果沒(méi)有大語(yǔ)言模型應(yīng)用工具,團(tuán)隊(duì)在檢索二氧化碳時(shí),可能需要輸入‘二氧化碳’‘CO2’‘carbon dioxide’等其不同語(yǔ)言和形式的名稱,才能檢索完備。而在大語(yǔ)言模型工具的幫助下,我們只需輸入上述名稱中的任何一個(gè),就能把想找的所有內(nèi)容檢索出來(lái),大幅提升了效率。”
AI提升數(shù)據(jù)檢驗(yàn)效率。徐明介紹,每名團(tuán)隊(duì)專家按照預(yù)先制定的標(biāo)準(zhǔn)搜集數(shù)據(jù)后,會(huì)有另外兩名專家對(duì)數(shù)據(jù)質(zhì)量進(jìn)行交叉檢驗(yàn)。同時(shí),大語(yǔ)言模型應(yīng)用工具作為第三名“專家”可查找出其檢驗(yàn)?zāi)芰Ψ秶鷥?nèi)的問(wèn)題。
齊劍川表示,大語(yǔ)言模型應(yīng)用工具可以將團(tuán)隊(duì)成員搜集的單元過(guò)程數(shù)據(jù)自動(dòng)轉(zhuǎn)換成搭建數(shù)據(jù)庫(kù)所需的ILCD數(shù)據(jù)格式,進(jìn)一步提升數(shù)據(jù)庫(kù)建設(shè)效率。
“我們還在不斷升級(jí)大語(yǔ)言模型應(yīng)用,擴(kuò)展人機(jī)交互邊界,目標(biāo)是把重復(fù)性、機(jī)械性的勞動(dòng)都交給機(jī)器來(lái)做,讓團(tuán)隊(duì)專家專注于貢獻(xiàn)增量知識(shí)。”齊劍川說(shuō)。
本`文-內(nèi).容.來(lái).自:中`國(guó)^碳`排*放*交^易^網(wǎng) ta np ai fan g.com
產(chǎn)品碳足跡不以排放主體而以產(chǎn)品為抓手來(lái)衡量減排水平
【版權(quán)聲明】本網(wǎng)為公益類網(wǎng)站,本網(wǎng)站刊載的所有內(nèi)容,均已署名來(lái)源和作者,僅供訪問(wèn)者個(gè)人學(xué)習(xí)、研究或欣賞之用,如有侵權(quán)請(qǐng)權(quán)利人予以告知,本站將立即做刪除處理(QQ:51999076)。