这一段时间一直在对博客的主题进行优化和修改,力图把主题做到最好。这不昨天就遇到个问题,今天有时间就把这个问题给记录下来。
由于自己做的主题是基本uft-8编码方式来编写的,平时修改模版文件的时候懒的使用专门的网页编辑器,都是用windows自带的文本编辑器,所以导致一些乱码,或是网页带有BOM属性等问题。
BOM签名解释:
BOM 是 Byte Order Mark 的缩写。是UTF编码方案里用于标识编码的标准标记,在UTF-16里本来是FF FE,变成UTF-8就成了EF BB BF。这个标记是可选的,因为UTF8字节没有顺序,所以它可以被用来检测一个字节流是否是UTF-8编码的。
网页中的BOM签名:
在网页上使用BOM是个错误。BOM设计出来不是用来支持HTML和XML的。要识别文本编码,HTML有charset属性,XML有encoding属性,没必要拉BOM撑场面。虽然理论上BOM可以用来识别UTF-16编码的HTML页面,但实际工程上很少有人这么干。毕竟UTF-16这种编码连ASCII都双字节,实在不适用于做网页。
几个常出现的问题
1.网站打开空白
2.页面头部出现多余的空白,或网站源代码里头部出现多余的空白
3.网站出现乱码,如“锘�”等
解决方法:
1.选用专业的编辑器,例如notepad++,sublime,editplus这样不会自动签名。
2.sublime通过如下操作File -> Save with Encoding -> UTF-8保存后即可去除bom
3.notepad++选中格式 -> 以UTF-8格式编码 选项即可去除
批量解决方法:
如果网站中所有的或大部份文件需要去掉BOM签名的,一个文件一个文件的去操作就显得要麻烦很多。这不针对这种情况,有大神提供了以下代码。
<?php if (isset($_GET['dir'])){ //设置文件目录 $basedir=$_GET['dir']; }else{ $basedir = '.'; } $auto = 1; checkdir($basedir); function checkdir($basedir){ if ($dh = opendir($basedir)) { while (($file = readdir($dh)) !== false) { if ($file != '.' && $file != '..'){ if (!is_dir($basedir."/".$file)) { echo "filename: $basedir/$file ".checkBOM("$basedir/$file")." <br>"; }else{ $dirname = $basedir."/".$file; checkdir($dirname); } } } closedir($dh); } } function checkBOM ($filename) { global $auto; $contents = file_get_contents($filename); $charset[1] = substr($contents, 0, 1); $charset[2] = substr($contents, 1, 1); $charset[3] = substr($contents, 2, 1); if (ord($charset[1]) == 239 && ord($charset[2]) == 187 && ord($charset[3]) == 191) { if ($auto == 1) { $rest = substr($contents, 3); rewrite ($filename, $rest); return ("<font color=red>BOM found, automatically removed.</font>"); } else { return ("<font color=red>BOM found.</font>"); } } else return ("BOM Not Found."); } function rewrite ($filename, $data) { $filenum = fopen($filename, "w"); flock($filenum, LOCK_EX); fwrite($filenum, $data); fclose($filenum); } ?>
把以上代码保存成一个PHP文件,并上传到网站服务器的根目录中,然后访问此文件。
运行结果如下图所示
以上代码可以检查网站的所有网页文件,是否含有BOM签名,如果有就会去掉此属性。
本文PHP一键去除网页BOM属性 完美如何解决网页乱码等问题到此结束。不问收获,但问耕耘!天道酬勤。小编再次感谢大家对我们的支持!