(圖片來源:圖蟲創(chuàng)意)
事實證明,在許多領(lǐng)域,數(shù)據(jù)科學(Data Science)是企業(yè)的最佳盟友。但你知道數(shù)據(jù)科學是如何工作的嗎?
我們采訪了Eurora的數(shù)據(jù)科學家Simo Jaanus。他解釋了什么是數(shù)據(jù)科學,數(shù)據(jù)科學家會面臨哪些挑戰(zhàn),以及Eurora如何利用數(shù)據(jù)科學來提供更可靠的服務。
“鑒于今天產(chǎn)生的巨大數(shù)據(jù)量,數(shù)據(jù)科學是許多行業(yè)的重要組成部分,如跨境合規(guī)。”——Simo Jaanus, Eurora數(shù)據(jù)科學家
跨境合規(guī)是Eurora使用數(shù)據(jù)科學將合規(guī)性提高到新水平的領(lǐng)域。數(shù)百名專家、科學家、分析師和研究人員開發(fā)了跨境貿(mào)易合規(guī)方面的機器學習。
(圖片來源:Eurora)
Simo是Eurora數(shù)據(jù)科學團隊的一員,他是數(shù)據(jù)科學家和機器學習工程師。
他畢業(yè)于塔爾圖大學,這是世界排名前1.2%的大學之一。在那里,他獲得了軟件工程的碩士學位。Simo在成功通過他的碩士論文 《為產(chǎn)品圖像的HS編碼預測建立分類模型 》后獲得了學位。
他的研究工作將有助于改進Eurora的人工智能引擎,該引擎是由我們的專家建立的。
以下是他與我們分享的內(nèi)容。
1、什么是數(shù)據(jù)科學(Data Science)?
數(shù)據(jù)科學是一個研究領(lǐng)域,它結(jié)合了領(lǐng)域?qū)I(yè)知識、編程技能以及對數(shù)學和統(tǒng)計學的理解。其目的是從數(shù)據(jù)中提取有意義的洞察力。
數(shù)據(jù)科學家在各種數(shù)據(jù)類型上使用機器學習(ML)算法:數(shù)字、文本、照片、視頻和音頻。他們從中創(chuàng)造出人工智能(AI)系統(tǒng),可以進行通常需要人類智慧的活動。
這些系統(tǒng)產(chǎn)生的見解,分析師和商業(yè)用戶可以轉(zhuǎn)化為實際的商業(yè)價值。
“鑒于今天產(chǎn)生的巨大數(shù)據(jù)量,數(shù)據(jù)科學是許多部門的一個重要組成部分,如跨境合規(guī)。”Simo說道。
數(shù)據(jù)科學家每天都在處理許多問題:我們應該如何使用這些信息?我們?nèi)绾卫盟鼇戆l(fā)揮我們的優(yōu)勢?我們能從中找到什么實際用途?
自從數(shù)據(jù)科學變得越來越流行以來,企業(yè)已經(jīng)開始使用它,這樣他們可以擴大他們的業(yè)務,提高消費者的滿意度。在跨境合規(guī)領(lǐng)域,Eurora使用了數(shù)據(jù)科學,這是解決該方案的核心。
2、Eurora為什么要使用數(shù)據(jù)科學?
Eurora使用數(shù)據(jù)科學來自動分配HS編碼。我們使用AI(人工智能)分配HS編碼,以基于文本的產(chǎn)品描述作為輸入數(shù)據(jù)。
協(xié)調(diào)制度(HS)是一個國際編碼系統(tǒng),用于對貿(mào)易商品進行分類。它是跨境貿(mào)易的支柱,因為它被海關(guān)當局用來識別產(chǎn)品和評估適用的稅收。鑒于HS編碼的重要性,在分配這些編碼時,是沒有模糊分配或者錯誤分配的空間的。
這就是為什么在貿(mào)易合規(guī)中使用數(shù)據(jù)科學會更加安全。Eurora的數(shù)據(jù)科學主管Kristi Helekivi在之前的采訪中解釋了為什么使用AI來分配HS編碼是最可靠的方式。
人工分配很容易出錯,一個人不可能熟記整個HS命名法,該命名法大約有5300個HS編碼。通過使用機器,可以獲得準確的數(shù)據(jù),也可以處理更大量的數(shù)量。
“一臺機器比一個人的知識儲備更廣闊。有了人工智能,所有來自不同人的知識都能被一臺機器學習并吸收。”Simo補充說道。
如果企業(yè)知道如何使用數(shù)據(jù),他們可以從數(shù)據(jù)中獲益良多。數(shù)據(jù)科學家的任務之一正是在業(yè)務方面也發(fā)現(xiàn)和引入可能性。數(shù)據(jù)科學還幫助Eurora從競爭對手中脫穎而出,因為它使公司能夠跟上市場需求,給客戶提供他們想要的服務。
數(shù)據(jù)科學將領(lǐng)域知識、編程技能和數(shù)學結(jié)合起來,以減少人工勞動。——Simo Jaanus
3、數(shù)據(jù)科學在合規(guī)領(lǐng)域的挑戰(zhàn)是什么?
盡管使用數(shù)據(jù)科學在監(jiān)管合規(guī)方面是一筆真正的財富,但它也有它的難處。
Simo和我們詳細解釋道:“當你開始一個數(shù)據(jù)科學項目時,第一步就是要找到所需要的數(shù)據(jù)來開始工作。因此,數(shù)據(jù)科學家從一開始就可能面臨挑戰(zhàn)。”
當Eurora開始開發(fā)其引擎時,并沒有那么多可用于電子商務的有效數(shù)據(jù)。盡管如此,Eurora還是設(shè)法收集了高質(zhì)量的數(shù)據(jù)。“我們建立了一個團隊和系統(tǒng),能夠快速有效地驗證新的數(shù)據(jù)。”
數(shù)據(jù)科學和機器學習正在迅速發(fā)展。每個月都會有新的發(fā)現(xiàn)和解決方案待解鎖。因此,跟上這些發(fā)展很耗時,圍繞它們建立可用的系統(tǒng)架構(gòu)也需要時間。
正如Simo所解釋的,除了每天會有大量的新發(fā)現(xiàn),需要及時提供解決各種解決問題的策略也會讓人不知所措。
找到正確的行動路線和解決方案需要大量的知識、時間和實驗。——Simo Jaanus
由于Eurora是該領(lǐng)域的先驅(qū),數(shù)據(jù)科學團隊還面臨著其他關(guān)于關(guān)鍵績效指標和衡量標準的挑戰(zhàn)。“我們?nèi)栽趯ふ乙粋€有效、簡單和易懂的追蹤進展的最佳方式,因為我們正在建立一個之前從未自動完成的東西。”
4、Eurora如何克服數(shù)據(jù)科學的挑戰(zhàn)?
正如Simo所解釋的,使用人工智能分配HS編碼是提供準確結(jié)果的最可靠方式。盡管如此,它仍可能面臨挑戰(zhàn),因為它依賴于客戶提供的輸入。客戶需要向引擎提供準確的產(chǎn)品描述,以便它能夠確定正確的HS編碼。為了避免引擎因為描述不完整而無法分配HS編碼的情況,數(shù)據(jù)科學團隊進行深度研究,并正在實施一個根本原因的檢測機制。
“我們的機器正在自動檢測根本原因,即時指出是否有任何必要的信息沒有正確填寫,這樣客戶就可以立即調(diào)整他們的產(chǎn)品描述。該團隊已經(jīng)對描述實施了產(chǎn)品、材料和細節(jié)檢測。從這些結(jié)果中,我們可以確定產(chǎn)品、材料或細節(jié)對于最終的根本原因預測是否是必要的,或者HS編碼是否可以在沒有它的情況下進行分配。由于我們剛剛實現(xiàn)了這一功能,目前我們?nèi)栽趦?nèi)部評估結(jié)果,并只在付費客戶要求時提供反饋。近期的目標是及時確定根本原因,甚至建議可以利用更多的描述詞來正確分配HS編碼。”
此外,該團隊目前正在調(diào)查新的數(shù)據(jù)輸入類型以分配HS編碼。他們發(fā)現(xiàn),基于圖像的數(shù)據(jù)可能是一種非常有資源的方法,這一點被Simo的研究工作所證實。Simo的碩士論文名為 《從產(chǎn)品圖像中建立HS編碼預測的分類模型》。他的研究工作的目的是發(fā)現(xiàn)從圖像中預測HS編碼的最有效方法。
他發(fā)現(xiàn)了非常有希望的結(jié)果。“通過圖片,我們不需要細節(jié)來分配HS編碼,因為大部分的信息都是非常直觀的。為了找到最佳的解決方案,我在論文中試驗了各種機器學習的人工神經(jīng)網(wǎng)絡(luò),將準確性和推理速度考慮在內(nèi)。表現(xiàn)最好的模型能夠產(chǎn)生與人類專家非常相似的結(jié)論,甚至超過了三個模型中的兩個。”
即使這些結(jié)果是有希望的,該團隊仍在不斷進行應用研究,調(diào)研在商業(yè)中實施其發(fā)現(xiàn)。
從長遠來看,這也為使用基于文本的產(chǎn)品描述和圖像給出最準確的預測鋪平了道路。——Simo Jaanus
5、Eurora計劃在未來如何進一步發(fā)展數(shù)據(jù)科學?
數(shù)據(jù)科學團隊將繼續(xù)研究模型。他們計劃嘗試使用嵌入式模型或更強大、更快速的模型。計算機視覺是不斷發(fā)展的,新的模型也經(jīng)常被建議。
“作為一名數(shù)據(jù)科學家,要接觸創(chuàng)新和研究。我們有很多有趣的想法來改進Eurora的AI引擎。每天都有新客戶來使用我們的服務,所以我們可以收集更多有用的數(shù)據(jù)和反饋來改進系統(tǒng)。”Simo和我們分享道。
除了HS編碼分配,該團隊計劃使用數(shù)據(jù)科學來改善Eurora在其他領(lǐng)域的活動。這可能包括使用數(shù)據(jù)科學來改善Eurora的網(wǎng)頁和用戶體驗,甚至是翻譯和語言檢測。
如果一切按計劃進行,將有數(shù)十億行的數(shù)據(jù)可供我們分析和訓練模型。——Simo Jaanus
Simo堅信,數(shù)據(jù)科學將幫助Eurora實現(xiàn)極高的目標。
我堅信我們在Eurora所做的事情,并理解這是一件意義重大的事情。因此,已經(jīng)有跡象表明,Eurora可能會成為下一個獨角獸、十角獸,或者是百角獸。我希望數(shù)據(jù)科學能夠協(xié)助企業(yè)朝著這個方向發(fā)展!——Simo Jaanus
數(shù)據(jù)科學不僅有助于HS編碼分配過程,也有助于關(guān)稅和稅收計算、IOSS、限制篩選和清關(guān)服務。你愿意用安全的基于人工智能的解決方案讓你的合規(guī)流程自動化嗎?Eurora就在這里,隨時為你提供有效的解決方案!
想要了解Eurora如何助力您的跨境業(yè)務,敬請聯(lián)系sales.cn@eurora.com
Eurora是一家可以提供跨境貿(mào)易全鏈解決方案的基于人工智能和機器學習的科技公司。Eurora不同的組合服務,包括IOSS解決方案、OSS&VAT注冊服務、HS編碼適配服務、關(guān)稅及稅金計算服務、限制方&違禁品篩查及歐盟在線化清關(guān)方案,可以幫您實現(xiàn)報稅自動化和清關(guān)自動化,從而幫您節(jié)約時間成本和人工成本。
(編輯:江同)
(來源:Eurora)
以上內(nèi)容僅代表作者本人觀點,不代表雨果跨境立場!如有關(guān)于作品內(nèi)容、版權(quán)或其它問題請于作品發(fā)表后的30日內(nèi)與雨果跨境取得聯(lián)系。