數字化轉型是一個龐大的命題,每個企業和行業的實際管理與水平差異較大,盡管許多企業已經在數字化的轉型中付出行動,但不可避免地在實施、技術和場景結合上遇到困難之處。
從輕量化的角度出發,運用輕量化的工具、系統和平臺做簡單的應用,既可以增強企業對數據化應用的了解和信心,也能為后續投入提供決策支持。
企業數字化運營的基本邏輯
近年來已經有一些企業從信息化跨越到數字化。信息化階段就是提升各個業務系統的運行效率,但是業務之間橫向的數據連通是非常困難的。而數字化的核心就是用數據解決運營問題,所以數字化運營首先要拉通數據,打通各個系統之間的連接;只有解決數據治理層全面拉通的問題,才能稱之為真正的數字化。
工業4.0中談到三個集成,不管是縱向集成、橫向集成還是端到端的業務集成,都是靠數據打通的。現在很多企業實際上做得比較多的是從OT到IT縱向層面的拉通,而端到端的業務層面,包括橫向集成的范圍實施難度更大。
工業大數據的特點
現在商業大數據的整個應用實際上已經比較成熟,但工業大數據里數據類型其實是不一樣。它既包含已有的信息化系統數據,還包括現在越來越多的將成為最主要數據的IoT工業互聯網數據,這些數據來自現場設備、工礦、生產狀態和人員操作,是非常大體量,需要特別關注的;以及還有一部分來自外部數據,包括我們供應鏈的數據、經營數據等。
根據數據來源可以發現工業大數據具有以下幾個特點:
● 大體量 (Volume):3D打印一個中規模部件產生幾十GB數據;
● 多樣性 (Variety):三維圖形數據,監控視頻數據,設備日志數據、RFID數據等;
● 快速性( Velocity ):處理速度是毫秒級,例如發動機運行監測數據;
● 價值密度低 (Valve):工業大數據的價值是顯性,但數據跨度、維度太大;
● 數據豐富,信息貧瘠;流與批計算模式同時存在;
商業互聯網平臺本身就帶有很強的數字化基因,但整個工業領域很大程度上都很難跟數字化直接關聯,因此也很難用一個很好的平臺來進行展示。光從設備管理來說,不同的設備機臺的規律運行之間的差異是非常大的。如何對數據進行挖掘和建模,呈現出好的應用效果對工業企業是非常大的挑戰。
從這幾年的一些項目實施上來看,工業大數據架構的途徑已經豐富了。比如可以先用一些場景化、輕量化的系統軟件來輔助把整個數據和模型跑通;第二是通過一些具有低代碼特性的數據化平臺,幫你快速構建數據平臺;第三種是工業互聯網,像百度借助于人工智能的一些應用,通過收購和并購的方式快速切入一些工業場景,充分發揮人工智能在工業場景上的應用。
現在的工業物聯網已經發生了很大的變化。它能夠吸納各種類型數據,數據連接能力非常強;第二是它有很好的中臺結構概念,可以讓我們快速能夠復用,構建所需要的場景;第三是它呈現出多樣化的應用層面。工業大數據平臺不應僅僅是靈活的大數據存儲系統,應是業務主題為中心的數據服務提供者,支持知識沉淀,快速迭代,消除壁壘的協同應用平臺。
輕量化應用對企業的能力要求并不高,企業在上自己專用大數據平臺或通過工業互聯網方式接入的時候,可以把已有的經驗和工作場景直接進行融合。
工廠大數據的典型應用
工廠大數據的場景應用比較多,從產品創新,設備預置性維護到供應鏈運營優化等。這里選取差異比較大的2個場景應用來具體說明。
場景應用案例1:輕量化數據挖掘工具
半導體行業在生產過程中會經歷多次摻雜、增層、光刻和熱處理等復雜的工藝制程,每一步都必須達到極其苛刻的物理特性要求,高度自動化的設備在加工產品的同時,也同步生成了龐大的檢測結果。這些海量數據究竟是企業的包袱,還是企業的金礦呢?
大家走進臺積電這樣企業的工廠現場,會發現這是一個高技術密集型、高資產投入型的行業,在晶圓檢測時,要檢測每個點、每個位置的質量,數據量和工作量是非常大的。
以GMP軟件為例。125片晶圓有17 萬行數據,質量 OK的用0表示,壞點用1表示。這些壞點分布的情況有一定的特性,對應了某種后臺的機理,比如說是材料問題還是工藝問題,或是加工過程中的一些環境造成的。
這個軟件本身已經具備了一些算法功能,比如說聚類算法,用簡單的層次聚力讓系統先跑一遍。這么多數據分別應該是哪幾類質量異常,之后工藝技術人員再進一步分析,就可以更精確、更迅速地能夠判定到底是什么成因。
通過GMP軟件,數據和業務場景都有了,算法的整體思維也有,可以在很短的時間里給出一個結果,便于你去選擇。
對于工業數據的應用大家要注意評估每一種模式最終的應用成效,這種評估將來是要作為一個經驗化的方式固化到整個系統中。在真正的應用價值體現之前,花巨資上系統的風險很大。通過這種輕量化的形式,在將來可以把這種形態融合到整個系統中去的。
場景應用案例2:生產計劃排程的復雜化
排程是很多行業都存在的一個典型問題,也就是APS。APS真正要稱之為APS一定有一個算法引擎。評估一個系統是否具備APS功能,要看訓練速度怎么樣,是否具有模擬功能,能夠適應多少種約束類型等。
所以對排程的定義是一個我們稱之為一個大數據體量進行全局化優定尋優的這樣一過程,它一定不涉及原來憑人工經驗在有限的約束條件下巡游的。
像圖片中的例子有6個工單,每個工單會涉及到多個工序。比如第一個工單6個工序,第一個工序可以在3號機床上加工,也可以在10號機床上加工。在3號機床加工的時間是3分鐘,在10號機床加工是5分鐘,這個可以選擇,以此類推。
可以看到一共有10臺加工機床,其中有很多加工機床是共用的,而每一個訂單的加工路線和時間也是不一樣的。在這種情況下,我們要找到一個最短時間能完成的優先順序,能夠確保資源浪費最低,機臺損失時間最低。同時整個從第一道工序到最后一道工序,六個訂單全部結束,其實是非常困難的。
這里會涉及到一個遺傳算法,就是在有限的成本條件下取得相對最優的概念。如果讓一臺計算機運行程序獲得一個最優結果是可以,但如果運行時間是三個月,是完全不具備可行性的。所以為了能夠更好地運行,現在開發出很多這種啟發式算法,就是借助生物學上的概念,通過每一代的進化用遺傳手法把更好的結果選擇出來,并不斷迭代到一個相對滿意的結果。
所謂輕量化應用就是對于不同的場景,用類似環境實現短平快能上手。如果想把這些場景做更好的封裝,就可以通過包括低代碼的開發環境等來實現,把一些成熟優秀的經驗固化進去,將來真正在使用的時候就是一個比較商業化的App系統。
通過這兩個場景化的案例,希望建立起大家對應用的信心,通過數字化的場景應用快速提高運營的效率。平臺再復雜,無外乎就是數據加算法,加一些可視化展現形式,只要這條路跑通,加上對行業場景的熟悉度,肯定能做出不錯的應用效果。