什麼是大數據(Big Data)?

大數據是指不斷以越來越快的速度增長的大量、多樣化的信息集合。它包括信息的體量、創建和收集的速度,以及所涵蓋的數據點的多樣性(即大數據的「三個V」)。大數據通常來自數據挖掘,以多種格式出現。

主要要點

  1. 大數據是大量且多樣的信息,它以不斷增大的體量和越來越高的速度出現。
  2. 大數據可以是結構化的(通常是數字化,易於格式化和存儲)或非結構化的(自由形式,不易量化)。
  3. 幾乎每個公司部門都可以利用大數據分析的結果,但處理其雜亂和噪音可能會帶來問題。
  4. 大數據可以從社交網絡和網站上公開分享的評論中收集,從個人電子產品和應用程序中自願收集,通過問卷調查、產品購買和電子簽到收集。
  5. 大數據通常存儲在電腦資料庫中,並使用專門設計來處理大型、複雜數據集的軟體進行分析。

大數據的運作方式

大數據可以分為非結構化或結構化。結構化數據包括已被公司管理於資料庫和電子表格中的信息;其性質經常是數字化的。非結構化數據是未組織、未預定模型或格式的信息。它包括從社交媒體來源收集的數據,這些數據幫助機構收集關於客戶需求的信息。

大數據可從社交網絡和網站上公開分享的評論中收集,從個人電子產品和應用程序中自願收集,通過問卷調查、產品購買和電子簽到收集。智能設備中的傳感器和其他輸入允許在廣泛的情景和情況中收集數據。

大數據通常存儲在電腦資料庫中,並使用專門設計來處理大型、複雜數據集的軟體進行分析。許多軟體即服務(SaaS)公司專門從事這種類型的複雜數據管理。

大數據的用途

數據分析師查看不同類型數據之間的關係,如人口數據和購買歷史,以確定是否存在相關性。這些評估可以在內部進行,或由專注於將大數據處理成可消化格式的第三方外部完成。企業通常會利用這些專家的大數據評估將其轉化為可操作的信息。

許多公司,如 Alphabet 和 Meta(前稱 Facebook),使用大數據通過在社交媒體和網際網路用戶上投放精準廣告來生成廣告收入。

幾乎每個公司部門都可以利用數據分析的結果,從人力資源部門和技術部門到市場營銷部門和銷售部門。大數據的目標是提高產品上市速度,減少獲得市場採納的時間和資源,定位受眾,並確保客戶滿意。

大數據的優勢和劣勢

數據量的增加既帶來機遇也帶來問題。總的來說,擁有更多關於客戶(和潛在客戶)的數據應該允許公司更好地定製產品和市場營銷努力,以創造最高水平的滿意度和重複業務。收集大量數據的公司有機會進行更深入和更豐富的分析,以對所有利益相關者有利。

考慮到當今個人數據的量,企業必須採取措施保護這些數據;這一話題在當今線上世界中成為熱議話題,特別是近年來公司經歷了許多數據洩露事件。

雖然更好的分析是一個積極因素,但大數據也可以創造過載和噪音,降低其實用性。公司必須處理更大的數據量,並確定哪些數據代表信號,哪些是噪音。決定何種數據相關變成一個關鍵因素。

此外,數據的性質和格式可能需要在使用前進行特殊處理。結構化數據,由數值構成,易於存儲和排序。非結構化數據,如電子郵件、視頻和文本文件,可能需要應用更多精細技術才能變得有用。