本帖最后由 kelgood 于 2017-7-18 21:46 编辑
6 I# d0 Y- ~2 _2 G 3 e1 P0 C) t, u+ t' C2 s* k
与其说有没有帮助,不如说靠不靠谱?* D. O0 p# n/ b, p! y4 N: y, x% P, v# A
我有一个朋友是哥伦比亚大学研究生数学专业,专门做算法和数据分析的,最近暑假回国实习。7 {. U" r2 j8 r: v/ p
然后我和他聊天,就说到我做的这个行业,今天他还特意来我这里看了我电脑上的数据。
7 s4 R: C B7 Z* F$ ~- E 因为我之前也在STM上面看到过一篇关于贝叶斯算法的贴子,就跟他聊了一下。
- E* T' D6 @! u- Y 他说贝叶斯算法只能做到90%的准确率,现在基本都是用神经网络或者深度学习。他还说了好几个其他算法的词汇,我就记不得了。。
# {& N7 a+ g$ e% h8 _* R 然后我给他看的是我EXO和VOL上面的数据,他简单了解了以后竟然跟我说。1 w! u7 h/ ?5 M( |4 n) N" U
他可以通过现有的数据分析出哪些数据应该删除,哪些数据应该留下。! v% I" }4 _; g( C. J
这个我倒觉得没有什么神奇的。因为我自己通过经验,也可以判断出个大概,只不过就是累一些工作量大一些。准确度也没那么高。
5 m. A6 j) ~! ]2 b T; V! o 但就算没有算法,我人工自己来也能达到差不多的效果。
6 t; q) S" E4 ]/ b! n/ O$ ~* g 但是他又跟我说了一个我感觉比较神奇的效果。。他说通过神经网络,当我有新的数据进来的时候
' G: U' m+ o4 a 哪怕只有1美金的数据,甚至更少,他就可以通过神经网络来学习,然后告诉你这个数据未来是可以让你盈利的还是亏损的
$ ?8 p0 S" g5 r) h& X" R2 ` 并且正确率在95%以上。我听了以后当时感觉这太神奇了。。也表示了怀疑。
% @/ V; o' \2 \% p 但是他跟我说他在学校有一个课题,是一首贝多芬的曲子,只给了他前5分钟。然后他通过神经网络最后实现了
8 }+ Y- ?8 k! O 把后面整首曲子,都预测了出来。并且正确率百分百。。说了什么神经元之类的东西。还需要有大量的调试,; ]+ V+ P9 P4 r' X0 W
当正确率在90%以上但不是百分百的时候,弹出的曲子会完全不一样,但是懂音乐的人只要一听,就听的出这是贝多芬的曲子.
) s* |; S- W8 @% I5 V; i! `) o. W 他说最后完全实现的话,就是只要把数据的cvs导入进去,然后用python写一个脚本,一执行就可以- _$ W6 l0 r; I# n
说了这么些。。我其实就想问问大家,觉得这种神经网络的算法,用到我们这个行业的数据分析优化上,帮助会有多大?0 ?9 T. v! u. _( G0 e ~/ I, J: `
或者有没有现在就在这么做的朋友? 可以一起交流下啊=================================================
1 v" j8 C. v% ]7 y) \# ? 新的进展
8 H. ]+ H ?8 o7 M5 u0 x 我这个朋友现在回国实习的公司,垄断了国内机场70%以上的广告业务
/ v5 {, V' l# c& q$ B4 a8 q 他现在做的就是通过这些广告数据来做分析.4 K! ]5 b1 O, o& ]
但应用到什么地方我不太清楚。如果是通过分析数据来实现给机场和飞机的用户显示什么广告
/ D3 i3 o |( F- l6 o 那感觉是不是就和我们行业里的smartlink有些类似?( a/ K# {0 n8 j/ k1 S6 O
最近又有了些新的进展。我把我自己的数据发给了他。2 N' a6 c7 V6 I. F( `( h* R7 ]
他给我写了一个模型。发之前他说数据量越大越好。
; t& p& m2 n3 M! K* Q: G6 V 但是我在EXO上花费最多的一个项目,也就只有1W多刀。其他的项目有很多,但是他说前期最好是单个项目的数据! H- l4 f) e$ U8 X/ ^' r" F" |
模型写完之后,他说因为数据量太少的原因,现在只有75%-90%的正确率.
5 s- ^) f4 O+ | 但是随着我这个项目的数据越来越多的话,正确率也会慢慢提高。
0 Q" \7 c; I8 L4 ^: W* G4 V) h, _ 我准备最近跑出一些新的数据以后扔到模型里,然后看结果和我自己的经验对比看看差别有多大) l" [/ I8 D$ c' N7 @5 Z& L, p, U6 q6 B
到底是模型的更好还是我自己人工的更好。我现在的感觉是,就算这个模型的准确率做到了百分百,7 S( b3 V& {" U7 t
难道就真的可以百分百盈利?因为这里面的随机因素实在太多了啊。。我给他的那些数据里面参数是不包括这些随机因素的。5 d3 p0 A, h5 \( ^! z
而且这些因素的数据谁都无法获取到,就更别谈提供了。0 Z: h2 d' L& K+ E
等我这边试了模型以后,我再继续跟大伙讨论# |9 O R. J4 Q" ~& }
) G: ?! V( t1 Y9 T. P) _4 d
9 ?* }# @# F( b# [& C
* o- _# h" m r- E
评分
查看全部评分
相关帖子