もう16時か、
2ちゃんねる ■掲示板に戻る■ 全部 1- 最新50 [PR]女性必見!ネットで高収入バイト[PR]  

Baiduspiderウザすぎ!! ヽ(`Д´)ノ

1 :Name_Not_Found:2007/02/12(月) 09:28:49 ID:VBncqmd1
オレの鯖にBaiduspiderアタックしてくるんじゃねぇぇ!!!!


551 :Name_Not_Found:2009/02/07(土) 20:05:32 ID:???
ノーガード戦法なみのインパクトがある

552 :Name_Not_Found:2009/02/14(土) 06:42:40 ID:???
糞Baiduのお陰で、糞bot排除に目覚めた。

とりあえずBaidu一式(Baiduspider・Baiduspider+・BaiduImagespider)はrobots.txtは
読むものの従わない事が理解できたので、.htaccessで403吐かせてたらそこから2日
後にパタリと来なくなった。

Baiduとは関係なさげなんだけど

150.70.84.24
150.70.84.46

こいつ何?
今回のBaidu排除作業上、改めてlog精査してみたら、うちのindexに定期的(キッチリ
2hに1度)にping打ってきてる事が判明。
今回こちらが気付いて、.htaccessで403吐かすまで、ずーーーーーーっと

150.70.84.24
から定期ping打ってきてて、.htaccessで403吐かせたら、次の日から

150.70.84.46
で再び同様の定期ping活動を再開。

クローラーでもなさげだし、何だろうと思って具々ってみたら、他所のサイトのアク解
ページても頻繁にこのip出てくる。
何なのコレ? 気持ち悪くてかなわん。

553 :Name_Not_Found:2009/02/14(土) 06:47:53 ID:???
150.70.84.24
150.70.84.46
Asia Pacific Network Information Centre

だと
何の為に定期的にうちに?

554 :Name_Not_Found:2009/02/14(土) 12:32:59 ID:cnvB4FYY
150.70.84.* の中から全て同じ動きで来るから 150.70.84.0/24 で弾くが良い
しばらく放っとくと、来なくなるみたい。正体は未だ不明


555 :Name_Not_Found:2009/02/14(土) 13:00:46 ID:cnvB4FYY
正体分かった、トレンドマイクロらしいわ。
ttp://oshiete1.goo.ne.jp/qa3873771.html

556 :Name_Not_Found:2009/02/14(土) 18:03:56 ID:???
調査ありがと。

バスターが絡んでるのか…

バスター使ってるんだけど、2009になってクソ重くなったし、検出率なんかもやたら落ちたと評判だから、ちょうど他に乗り換えようかと思ってたとこ。
まあ

150.70.84.24
150.70.84.46

の定期pingも、糞Baiduほど負荷かける挙動はしてなさげなのでしばらく様子見るけど、あまり酷くなる様ならまた対策考えますわ。

557 :Name_Not_Found:2009/02/14(土) 21:38:24 ID:???
基地外と言ってもいいくらいのアクセス頻度じゃねーのか
トレンドマイクロ
全部Biaduにリダイレクトしてやってるが

558 :Name_Not_Found:2009/02/15(日) 18:27:06 ID:???
222.141.50.175

559 :Name_Not_Found:2009/02/19(木) 12:15:26 ID:???
こいつくそうぜええええ

560 :Name_Not_Found:2009/03/30(月) 12:44:30 ID:RNLtfV7M
博士まで出て、Baiduに就職・・・
死ぬの?

博士のための「けものみち」就職活動ガイド
http://blog.lilyx.net/2009/03/30/job-hunt-for-doctoral-students/

561 :Name_Not_Found:2009/04/07(火) 17:07:37 ID:???
蒋介石发表中国伤亡438万人
1985年中共发表中国伤亡2100万人
现在中共发表中国伤亡3500万人
ttp://www.rxhj.net/phpBB2/viewtopic.php?t=12744

あっちのNGWordを書いたら来なくなる

562 :Name_Not_Found:2009/04/10(金) 03:49:31 ID:???
これはいい事聞いた

563 :Name_Not_Found:2009/04/10(金) 04:15:52 ID:???
それ時々話題に出るけどさ、今のところはおまじない程度だと思うよ。
うちのトコや周辺サイトで実験したけど中国系BOTの襲来や中国のspamは止まず、
有意差は確認できなかった。金盾は存在しているのかもしれないけど、現時点では効果が
微妙と見る。そもそも国策検索エンジンの色もあるbaiduだけ穴を開けているかもしらん。

そういう単語が効果があると妄信して2chのあちこちにマルチポストして規制された馬鹿が居たんで、ま、程ほどにな。

564 :Name_Not_Found:2009/04/10(金) 06:48:52 ID:???
百度からの集客って、意味ある?
百度からのクロールを許可している人で見解を聞きたいです。

565 :Name_Not_Found:2009/04/10(金) 09:18:35 ID:???
今ははっきり言って意味茄子
数年後は分からん
素人向けのサイトつくればやふーからばっかりだしマニア向けのサイトつくればぐぐるからばっかりだな

566 :564:2009/04/10(金) 18:08:59 ID:???
>>565
そうですか。。。
私の場合、
gとyとmからの集客は
g>m>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>y
です。
百度は昔アク禁にして、
再考するとどうなるかな?
と思った次第です。

567 :Name_Not_Found:2009/04/12(日) 16:06:44 ID:???
しかし、ひでー仕様だな。
他人のサイトも登録出来ちゃう。
http://www.baidu.jp/info/help/webmaster/site/01.html

568 :Name_Not_Found:2009/04/13(月) 07:52:48 ID:???
うちのサイトのケースだと、
GとYは共に一万越えているのと同じ期間で(この両者はほぼ同数)、
百度から来たのは2人だけ。集客力はその程度。
わざわざ許可しても意味ないので、ブロックできているならその方がいいと思う。

569 :Name_Not_Found:2009/04/13(月) 09:31:36 ID:???
以前のようにエグいクロールはしてこなくなったから蹴ってはいないけどね
とりあえず画像やドガファイルへのアクセスはdenyしてる
ロボテキのdisallowにも従ってはいるみたいだが信用はしない

570 :Name_Not_Found:2009/04/13(月) 22:23:18 ID:???
コイツに拾われて良い事なんて無いから
永久追放

571 :Name_Not_Found:2009/04/14(火) 09:10:02 ID:???
うちもぐぐるから1マソアクセスある間に百度1アクセス
日本語な人で百度なんて使うのいるのかね・・・
それよりも最近MSNがウザいな

572 :Name_Not_Found:2009/04/14(火) 12:14:13 ID:???
MSNは最近ロボ増やした?
猛烈にアクセスあってびびったんだが

573 :Name_Not_Found:2009/04/14(火) 14:01:43 ID:???
クロールするなら客連れて来いってんだよなあ

574 :Name_Not_Found:2009/04/18(土) 09:37:23 ID:???
百度使ったのはエゴサーチしてみたときのみ
画像検索も別にたいしたことないし

575 :Name_Not_Found:2009/05/12(火) 21:16:20 ID:RLcvy2vM
定期的にbaiduを弾くIP範囲を教えて欲しい

576 :Name_Not_Found:2009/05/13(水) 09:05:05 ID:???
最近はロボテキでおk

577 :Name_Not_Found:2009/05/13(水) 22:16:32 ID:???
本当にどうでも良い事だが、ロボテキっていうキモい略語はどこから産まれたんだろうか。

578 :Name_Not_Found:2009/05/14(木) 23:10:58 ID:???
「二つの単語で構成されている名詞の略称は、それぞれの単語の頭二文字を足したもの」
ってのは、日本ではかなり昔から一般的じゃね?パソコンなんてない時代から。

579 :Name_Not_Found:2009/05/30(土) 08:03:31 ID:oKcoe+Qa
百度はエロ画像検索の分野では既に日本でもトップシェア

580 :Name_Not_Found:2009/07/31(金) 17:54:53 ID:???
追加 123.125.66.0/24

ただし確実ではないんで安心を選びたいなら

123.112.0.0/12

で弾くのが吉

581 :Name_Not_Found:2009/08/16(日) 00:57:56 ID:???
Baiduのロボット拒否してるけど、Baiduから「解除してくれないか」ってメールが来た。
ロボットばっかりで、それに見合う人を送り込んでくれないサーチエンジンは塵以下。

582 :Name_Not_Found:2009/08/20(木) 22:11:13 ID:???
>>581
そんなこと言ってくるの?
うぜぇぇぇぇぇぇ!!!

583 :Name_Not_Found:2009/09/03(木) 11:39:50 ID:???
拒否するに限る

584 :Name_Not_Found:2009/09/03(木) 22:23:46 ID:???
お約束のAA貼り付けて返信するだろ

585 :Name_Not_Found:2009/09/10(木) 05:12:48 ID:???
最近spinn3rとかいうのがウザいわ
久しぶりにロボテキ読むくせに爆撃してくるクローラー見た

586 :Name_Not_Found:2009/10/14(水) 11:27:42 ID:???
UA詐称するにしても、もうちょっと上手くやれよ(w
別に中国嫌いではない自分でも、中国人全体が信用できなくなる今日この頃

61.135.163.156 - - [13/Oct/2009:04:13:10 +0900] ****** "Baiduspider+(+http://www.baidu.jp/spider/)"
61.135.163.156 - - [13/Oct/2009:05:13:13 +0900] ****** "Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.0)"


587 :Name_Not_Fou:2009/10/15(木) 05:53:37 ID:???
中国人は人口多いからロボトもすごくたくさん。たくさんね。これからもと増えるよ。

588 :Name_Not_Found:2009/12/11(金) 09:56:45 ID:???
IPブロックと「公式の」拒否の意思表示タグ使ってるけど、
それでもまだまだクローラーとか山ほどきやがる。
当然httaccessではじいてるけど、はじくだけでもエラー出力して
サーバーの負担になるんだよな。いい加減にしろよ。
>>581-582でも話題になったメール、うちにも来たけど無視。

589 :Name_Not_Found:2009/12/11(金) 14:11:30 ID:???
どういうサイトにくるの?大手なんかな

590 :Name_Not_Found:2009/12/26(土) 10:01:01 ID:yOvbc0R3
baiduをrobots.txtで弾いたら狂ったように / にアクセス来てるんだが
つーか / も禁止してるんだよ糞クローラー
UAも偽装してるし

>119.63.193.70 - - [25/Dec/2009:01:09:55 +0900] "GET / HTTP/1.1" 200 953 "-" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1)"

591 :Name_Not_Found:2009/12/26(土) 10:29:43 ID:???
とりあえず「六四天安門事件」と「天安門大虐殺」あたりのワードをサイト内にちりばめといたら?

592 :Name_Not_Found:2010/01/05(火) 15:09:54 ID:n8ScyYOG
User-Agent: Baiduspider
disallow: /
User-Agent: Baiduspider+
disallow: /
User-Agent: BaiduMobaider
disallow: /
User-Agent: BaiduImagespider
disallow: /

ってrobots.txtに書いてもクロールするってどうしてなの?
もちろんロボテキはドメイントップにおいてる

593 :Name_Not_Found:2010/01/05(火) 16:33:22 ID:JMvrZzB6
クロールしたいからだろかと。
好きなんだよ勝手にクロールするのが

594 :Name_Not_Found:2010/01/05(火) 18:59:25 ID:???
ダライ・ラマ14世の画像でもサイト内に貼っといたら?w
シナ国では彼の画像(写真)を保有するだけでも公安の取締対象になるらしいしw

595 :Name_Not_Found:2010/01/05(火) 19:52:06 ID:n8ScyYOG
dw

Baidu www
まじしねw

596 :Name_Not_Found:2010/01/05(火) 21:02:39 ID:???
Baiduがちゃんとロボテキ読んでるか?
.htaccessに変なコト書いて読めなくしてたり

597 :Name_Not_Found:2010/01/05(火) 21:47:14 ID:24GNap0I
ロボットテキストにアクセスはしているが、読んでいるとは限らない。
とにもかくにも、なんでもかんでもアクセスしたらいいと思っているようだから、
ロボットテキストも単なるアクセス対象でしかないかとw

598 :Name_Not_Found:2010/01/06(水) 10:00:01 ID:???
中華の情報統制ってどんな感じでやってんだろ?
あやつらの事だからバリバリ人海戦術で、

「アイヤー またこんなサイト見つけたアルよー」
「アイヤーこっちも」
「アイヤー…」

ってな感じなんだろうか

そもそもクローラーも実は人力手動収集だったりして

599 :Name_Not_Found:2010/01/14(木) 23:15:29 ID:VnufXfq/
百度のクローラーが急にこなくなった。

600 :Name_Not_Found:2010/01/15(金) 11:33:58 ID:0qVZrY1p
CS2からCS4に移行しても
いまだにイマイチ理解できないブリッジ

使いこなせていないだけなのか、
はたまたファイル・データ管理能力にわたたしが優れているだけなのか
・・・存在理由がわかりませんw

128 KB [ 2ちゃんねる 3億PV/日をささえる レンタルサーバー \877/2TB/100Mbps]

取りに行ったけどなかった。次は一時間後に取りに行くです。
新着レスの表示

掲示板に戻る 全部 前100 次100 最新50
名前: E-mail (省略可) :


read.cgi ver 05.0.7.8 2008/11/13 アクチョン仮面 ★
FOX ★ DSO(Dynamic Shared Object)