人類希望通過人工智能,可以從機械且繁瑣的工作中解放出來,然而現實是,想要挖掘海量數據,實現判斷、預測等能力,很大程度上還需要依靠人的經驗去完成”特征工程“的工作。特征工程是一項龐大且耗時的工程,其中涉及到了模型選擇、數據處理、泛化等多方面的機器學習知識,以及需要對業務有一定的理解,目前該領域人才的匱乏很難與大數據的快速發展相匹配。
簡單來說,特征是數據抽取出來的對結果預測有幫助的信息;特征工程是為了使特征在機器學習算法和模型上發揮更優效果的過程,該過程往往需要數據科學家人工地找出
[登陸后可查看全文]