我有三个站点在同一个服务器上,有两个ip,其中一个站点加了SSL证书,也就是https
) @' X c1 T. V9 j
8 p3 D1 e5 U& F人工访问的时候,一切都是正常的。
W" o) X8 @% r/ b, |" b/ q2 o2 |; l# r8 G: O4 ^
在google和bing的搜索结果中,其他两个没有加ssl证书的网站搜索结果里面,很多加了ssl的内容,但是域名还是他们自己的。) y! B- S9 d0 `" E
+ _5 q8 `& i% J1 L: F* |( L) y
比如站点A是加了SSL的,B,C没有加。在site:B.com和site:C.com的结果中,很多内容是来自A的,但是域名是B和C自己的,而且前面加了https
% d3 \* c8 L' q5 L
1 B) z3 l9 ?$ \: c' u+ ~* J( S' D这个问题困扰我很久了,一切不知道怎么解决。问了digicert,他们否认是证书引起的。
6 f: V) K8 q; u$ y& ~, S0 V$ |3 {5 ?) E$ \2 `2 x8 r
一直没搞懂,为什么爬虫在爬B和C时,要去抓取A的内容。
* L; e. C4 {& }" T9 x5 R! R
0 r. j9 n4 K, D/ i6 M& n大神给的建议吧,多谢
0 f, m2 T' U6 _5 v, V$ d) H1 }- ?0 g9 ^/ X: q J
9 }9 y+ g9 Z& J, W6 ^
|