今天數據正在以前所未有的速度產生,每一個新的技術都將進一步推動這種趨勢。物聯網(IoT)、機器學習和醫療保健數字化,產生數據的速度很快就達到每秒數百萬千兆字節。根據IMB的一項研究,自動駕駛汽車也將很快加入——到2020年每秒將生成350MB的數據。
數據的產生與收集已經在企業中根深蒂固,時刻上演著大量數居的記錄與分析。但是,這些數據的存儲庫并不總是結構化和一致的。事實上,未知的和未使用的數據催生了一個新的術語——“黑暗數據”。
如果我們不改變存儲、管理、結構和分析數據的方式,大部分數據都將變得毫無價值。IMB同一研究表明,今天收集的所有數據中有80%是“黑暗的”,也就是說,這些數據是無效和不連貫的。未來數據量越大,“黑暗數據”引發的黑洞也就越大,導致的問題與挑戰就越嚴重。
存儲和安全
最大的挑戰是,“黑暗數據”不僅難以分析,而且也容易導致存儲問題。大量的非結構化數據——MS Office文件、即時消息、電子郵件、社交媒體帖子等形式獲得的數據就屬于此范疇。
上一篇: 【質量工具】5why分析法并不簡單! 下一篇: 提高產品質量的3-3-1法則
