国外对于文章的版权很重视,比如国内的这种采集,甚至伪原创都基本不可能, s& t* M5 b( d; h, |/ }
但是,我们知道关于文章原创度的审核机制和计算法则是在于搜索引擎而非人工4 i; k, o. y& }$ W( [6 l
蒙蔽一个人很难,但是,对于一个机器呢?
7 ]" C/ W6 |, r强大如谷歌,也只是一台机器# Q) Z @2 S, x' _% |
改变不了算法,但是人有自己的独特思维处理问题
( S0 o2 _+ c+ O# S为什么很多人对于伪原创嗤之以鼻?
f6 R: K" @1 p# j) ^" b8 }- `+ {! T( L原因有二:一是语句的不通顺,二是无法蒙蔽搜索引擎,搜索引擎不认可1 K* c: Y2 S ?" M
我个人觉得,所谓伪原创无非是同义词,近义词的替换,但是在TF/IDF和向量算法以及数据指纹方面处理的并不好,所以,计算方面,基本任何一款伪原创工具大概都过不了搜索引擎这一关,比如TBS9 t [. I# r& ^5 [* a w5 j
但从另一个方面说,你写文章的目的是什么?销售产品,那自然应该是语句通顺," _5 Z" ]! O8 E, r' |
6 T, @( I, |( Z ~# S) G) ~) {# E! F
6 n5 N/ g0 ]8 O5 ^. H同时,涉及版权和算法,只有一条路可走:外包,比如iwrite,比如textbroker,比如fiverr,等等
# }" o" y& w& L& \; i. x& }' s/ H* u5 P0 O7 p9 U' v
但如果文章的目的仅仅在乎原创而非可读,我觉得国内的文章翻译成国外,甚至用翻译软件,当然,这里最好不要用谷歌翻译,为什么,你懂的。
7 G5 D" t/ i2 M# \ T/ U4 j$ z4 v# B8 z. e
换句话说,如果做一个高级点的垃圾英文站,只在乎原创版权,而非可读,翻译文章,适当修改,应该差不多,,起码保证copyscape检测不到你是否原创和原创度多少,尽管文章可读性也许严重不通
' V' F* p8 L0 a$ p4 j4 G- v
& @4 U# Y4 U$ o) T以上是个人的一些见解,希望有这方面经验的高手指点一二 |