検索ロボットクローラ(IT用語)

検索ロボットクローラ

検索ロボットクローラとは

公開サイトを自動的に巡回し、文書や画像などのデータを収集するシステム

※目的に応じて、「収集するサイトの範囲」や「データの種類」「巡回頻度」などは異なるよ

検索ロボットクローラの動き

検索ロボットクローラの動き

①WebサイトのURLをリストにする

②そのリストに従ってWebサイトを訪れる

③Webサイトに到達すると、そのページのHTMLコードを読み込み、データを取得

④ページに含まれる他のWebサイトへのリンクがあれば、そのリンク先のURLをリストに追加

このようにして、Webサイトを芋づる式に巡回していきます。

CHATGPT4参照

会話で学ぼ

基礎知識編

【検索ロボットクローラ】って何?
インターネット上のウェブページを
自動的に巡回して
情報を収集するプログラムのことだよ。
どうやって動くの?
例えば、
Googleの検索エンジンは、
クローラを使ってウェブページを見つけ、その内容をデータベースに保存しているよ。

クローラはリンクをたどって次々にページを訪問し、
新しい情報や更新された情報を収集するよ。
なるほど、それで検索結果が最新の情報になるんだね。
クローラはどんな情報を集めるの?
クローラは、 
「ページのタイトル」「本文」「画像」「リンク」など、
さまざまな情報を集めるよ。

検索エンジンはその情報をもとに、
ユーザーが検索したときに関連性の高い結果を表示できるようにしているんだ。
それは便利だね!
クローラが訪問するページはどうやって決まるの?
クローラは、
検索エンジンのアルゴリズムに基づいて
訪問するページを決めているよ。

例えば、
「新しいページ」「更新されたページ」
「他のページから多くリンクされているページ」などが
優先的に巡回されることが多いんだ。

SNSで発信

X(元Twitter)

YouTubeショート

スタンドエフエム

【デジナンばあばチャンネル】

ばあばと、もに隊長のおもしろトークだよ(笑)

https://stand.fm/episodes/6577a6f6e07dbcdfe1f8bc2a

インスタグラム

https://www.instagram.com/reel/C-O2t1mSsnM/?igsh=MWM1eWw4dzYwaGE3eA==

tiktok

https://vt.tiktok.com/ZS214v768/

スレッズ

https://www.threads.net/@konomimoni/post/C0znepPSCfi/?igshid=NTc4MTIwNjQ2YQ==

あとがき

このサイトは

少しずつ、ヒントもしくは知識を共有していくサイトです。

最後まで読んでいただきありがとうございました♡

この記事が気に入ったら
フォローしよう

最新情報をお届けします

Twitterでフォローしよう

最新の記事