成人在线你懂的-成人在线免费小视频-成人在线免费网站-成人在线免费视频观看-日韩精品国产一区二区-日韩精品国产一区

掃一掃
關注微信公眾號

大數據的再思考:重點是如何快速挖掘數據?
2012-11-23   D1net

大數據的時代已經來臨,這一點沒有人會提出反對。當然,已經有很多的文章討論過,大數據的重點就是數據挖掘,或是說,如何在海量的非結構性數據里找出有意義的資料出來。意義可以是,客戶的某一些行為,供應商的某一些供貨和價格趨勢,庫存的某一些趨勢等。這些都是非常有價值的資訊。當通過數據挖掘,把有用的資訊放在一些圖像報表,或分析報表,讓高管可以根據報表所提供的資訊,做一些配合當時的商業決定,從而增加獲取利潤的機會。

在上面的描述里,不知道你有沒有發現一個最關鍵的地方,就是,從挖掘到報表產生,可以讓高管做決定的時間。 簡單的說,大數據的意義就是,如何可以在最快的時間里,從海量的數據里,挖掘并產生有用的報表,讓高管作出適時的決定。 如果整個過程需要的時間越長,報表的意義就越低。

舉個例子,在澳門或美國拉斯維加斯的賭場,都有一些專門對付不受歡迎賭客的系統。賭場在每一個重要的角落,都安裝有視像頭,從一個賭客進入賭場開始,他的面容已經進到賭場的海量數據庫里。一家賭場可能安裝有幾千個或以上的視像頭,一天24小時不斷的把海量的數據,傳送到數據庫里。賭場當然不會只是很被動的等到有老千干了事情,再從海量的數據復查,因為賭場有可能已經被騙了很多金錢。賭場的系統會從每一個賭客進入賭場開始,把他的面容特征,和數據庫做實時的比較。如果某人的面容,和數據庫里不受歡迎賭客的面容一致,賭場就會立刻邀請他離開賭場。整個過程的關鍵,就是時間。越長的時間,代表賭場有機會被騙的金錢越多。

大數據的核心設備,當然是存儲系統。所有的數據,都是從存儲系統送到應用服務器分析計算,再產生報表。在整個過程里,數據會在存儲系統和應用服務器間來回很多遍。時間的關鍵,就在于存儲系統的IOPS(Input/Output Operations Per Second,每秒進行讀寫操作的次數)。存儲系統的IOPS越高,整個數據挖掘的時間就越短,就是這么簡單。

但是,往往很多用戶都沒有在這一點上有太多的了解,或是,包括存儲系統供應商的人,可能也沒有太多的了解。結果是,實施后的數據挖掘方案,所需要產生報表的時間太長,根本沒法滿足原來想要的目標,并導致整個數據挖掘系統項目的失敗,投進去的錢變成白投。

所以,在你為一個大數據項目立項時候,一定要有很明確的目標,而目標不單是你需要的報表內容,更需要是獲取報表所需要的時間。目標明確后,一定要確保存儲系統的IOPS足夠支撐你定的目標。如果系統供應商的方案顧問在這一點上沒有很明確的意見,我建議你可以找別家來談,因為他們根本沒有抓到數據挖掘的核心重點。

熱詞搜索:

上一篇:工信部調查360瀏覽器結論:未侵犯用戶隱私
下一篇:市場調查 卡西亞解析IT運維的三大新興需求

分享到: 收藏
主站蜘蛛池模板: 高粱红了 电视剧| 2024年12月四级作文| 北京 北京 汪峰歌曲| 预备党员思想汇报1500字| 女人高潮私密按摩视频| 常蓝天| 水浒传新| 画江湖之不良人7季什么时候上映 画江湖之不良人第七季什么时候出 | 1988版14集电视剧平凡的世界 | 巴霍巴利王3电影免费观看| 触底反弹电影| 李洋演员个人简介图片| 我未成年 电影| 郑柔美个人简介| 科学试卷可打印(免费)| 黄视频免费| chaoporn| 少林问道演员表| 大森元贵| 《春天的故事》六年级的课本| 田文仲个人资料| 第一财经今日股市直播间在线直播| 我们的祖国是花园简谱| 周琳皓| 林正英电影大全| 囚徒 电影| sm在线| 张小波的个人资料简介| 第一财经在线直播今日股市 | 被打屁股作文| 张天爱演过的三级| russian institute| 侠侣探案| 成人在线免费观看电影| 孔令辉简历及个人资料| 搬山道人| 嗯啊不要啊啊| 杨幂吻戏| 人口高质量发展形势与政策论文| 杨新鸣| 无内秘书|