- 複数のRSSを統合し最新情報を取得する
- 2009.11.19
複数のサイトのRSSを受信し、その中の記事を日付の新しい順に何件か表示する場合、最初にRSSを一つにまとめるか、個別にRSSを受信し、その後統合、ソートとするかだと思いますが、今回はPHPで複数RSSを表示するプログラムを後者の方法で行なってみました。
PHP用のRSS パーサにはMagpieRSSというものを使用しました。
以下、プログラムソースです。
※カッコが全角になっているので、そのままコピペして使用しないでください。<?
require_once(‘./includes/magpierss/rss_fetch.inc’); //MagpieRSSロード
define(‘MAGPIE_OUTPUT_ENCODING’, ‘UTF-8’);//読み込むRSSを配列に格納
$rssUrl=array(“http://www.abc1.com/feed“,
“http://www.abc2.com/feed.rdf“,
“http://www.abc3.com/index.rdf“,
“http://www.abc4.com/rss.xml“
);//表示する記事の件数
$num=5;$HTMLbody =””;
foreach ($rssUrl as $no => $rss_url) {
if ($rss_url != ”) {
//URLからRSSを取得
$rss = @fetch_rss($rss_url);
if ($rss != NULL) {
for ($i=0; $i<count($rss->items); $i++) {
//サイトのタイトルをitemsに格納
$rss->items[$i][“site_title”] = $rss->channel[“title”];
}
//itemsだけ別配列に格納
$rssItemsArray[] = $rss->items;
}
}
}$concatArray = array();
if (is_array($rssItemsArray)) {
for($i=0;$i<count($rssItemsArray);$i++){
//配列を統合する
$concatArray = array_merge($concatArray,$rssItemsArray[$i]);
}foreach ($concatArray as $no => $values) {
$date=$values[“date_timestamp”];
$title=$values[“title”];
$link=$values[“link”];
$site_title=$values[“site_title”];
//記事ごとに必要な項目を抽出
$rssArray[]=array($date, $title, $link, $site_title);
}//配列をユーザー定義関数でソート
if ($rssArray) { usort($rssArray, ‘cmp’); }
if (count($rssArray) > $num) {
$count=$num;
} else {
$count=count($rssArray);
}//必要な件数分だけHTML整形
for ($i=0; $i<$count; $i++) {
$date=date(“Y-m-d H:i”,$rssArray[$i][0]);
$link=$rssArray[$i][2];
$title=$rssArray[$i][1];
$site_title=$rssArray[$i][3];
$HTMLbody .=$site_title.”【”.$date.”】<a href=””.$link.”” target=”_blank”>”.$title.”</a><br />n”;
}
}//=======================================================
// 多次元配列ソート用比較関数
// この場合は配列の1番目の項目を降順にソート
//=======================================================
function cmp($a, $b) {
if ($a[0] == $b[0]) return 0;
return ($a[0] > $b[0]) ? -1 : 1;
}
?>
<?php echo ‘<?xml version=”1.0″ encoding=”UTF-8″ ?>’.”n” ?>
<!DOCTYPE html PUBLIC “-//W3C//DTD XHTML 1.0 Transitional//EN”
“http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd”>
<html xmlns=”http://www.w3.org/1999/xhtml”>
<head>
<meta http-equiv=”Content-Type” content=”text/html; charset=utf-8″ />
<title>test</title>
</head>
<body>
<?= $HTMLbody ?>
</body>
</html>複数のRSSを処理すると、かなり遅いです。
試しに、perlでRSSを統合するプログラムも制作しましたが、こちらもそれなりのお時間がかかりました・・・ 😯改善策をご存知の方は、是非コメントください。
【この記事のタグ】
後日談ですが、複数のRSSを統合し表示するにはかなりの時間がかかっていたので、結局cronで定期的にRSSを統合し、その統合済みのRSSを読み込むように変更しました。
1時間毎にRSSを統合しているので、リアルタイムには情報は反映されませんが今のところ快適な表示になっています。