StackOverflow上找了一大圈,这个似乎是最靠谱的,但有点不符国情
function getPageTitle($url){
$doc = new DOMDocument();
@$doc->loadHTMLFile($url);
$xpath = new DOMXPath($doc);
return $xpath->query('//title')->item(0)->nodeValue;
}
大部分网站的title都可以抓到
有一部分会乱码,比如淘宝(因为charset是gbk的缘故?),除了英文字符外汉字全是乱码
有什么解决办法吗?
function getPageTitle($url){
$doc = new DOMDocument();
@$doc->loadHTMLFile($url);
$xpath = new DOMXPath($doc);
return $xpath->query('//title')->item(0)->nodeValue;
}
大部分网站的title都可以抓到
有一部分会乱码,比如淘宝(因为charset是gbk的缘故?),除了英文字符外汉字全是乱码
有什么解决办法吗?