Submitted by gouki on 2009, January 20, 10:54 PM
GET和POST接收编码格式不一样?说实话,原先没有考虑过这些问题。因为在一个项目中,程序的编码由项目开始到结束肯定都会一样的,当然在ajax处理的时候可能会有点变化。毕竟ajax的东西采用了UTF8进行传递。除此之外,其他的编码一般来说都是一致的。在看到这篇文章的时候,觉得不错。同时也是提醒一下自己需要注意。
因为他的代码是.NET的,临时转载,就不翻译成PHP了,看看别人的思路就行了。。。
原文地址:http://www.cnblogs.com/zhangziqiu/archive/2009/01/20/encoding.html
原文:
在查阅了一天资料,做了很多的试验, 精简提炼语言后, 完成了下面的文章.我发现在项目中太多的程序员对编码,尤其是Web程序中的中文参数编码一知半解.本文将作为一种规范提出, 以后将会应用到我制作的项目中.希望能够对大家有所启示.
[参数编码规范]
[原则]
避免在get或者post参数时直接传递中文字符.每次都经过指定格式的url编码后再传递.
[原因]
传递中文字符时,自动的编码解码格式和浏览器与服务器的设置有关.
测试Firefox3和IE6的Get方式发送中文参数, Firefox默认使用UTF-8格式编码中文参数, 而IE6即使在高级设置中设置了"总是以 UTF-8 发送URL", 仍然自动使用GB2312编码中文参数.
对于服务器端我们可以自由的控制解码的格式.但是往往是通过更改服务器配置进行全局的统一设置.比如对于ASP.NET程序.可以在Web.Config中设置服务器段的编码和解码格式:
XML/HTML代码
- <globalization culture="zh-CN" uiCulture="zh-CN" requestEncoding="UTF-8" responseEncoding="gb2312" />
但是我们没法控制浏览器端行为.用户可能使用不同的浏览器.
[解决方案]
一.统一默认的编码格式
1.设置服务器端的编码格式为UTF-8
2.传递参数全部进行编码,.服务器端(C#)使用Server.UrlEncode方法,客户端(javascript)使用encodeURIComponent方法.
说明:
客户端的javascript函数encodeURIComponent只能使用UTF-8编码格式. 所以需要设置服务器端request和response都为UTF-8.
缺陷是如果某些合作伙伴必须传递其他的编码格式的参数, 则服务器端或获取到乱码.此方案实现简单,适合大部分场景.
二.通过编码参数指定编码格式
为了解决可能存在的无法统一编码格式的问题, 我们使用一个参数"encoding"来显示的指定编码格式.encoding参数需要在所有的请求中传递,无论是get还是post.
1.对于javascript客户端编码而言, 仍然使用encodeURIComponent方法编码, 此时指定encoding参数的值为"UTF-8".
2.对于传入给服务器端的 其他编码格式, 比如GB2312, 我们不能使用默认的Request.Form或者QueryString方法进行编码.因为服务器端的编码格式可能设置为了UTF-8.此时使用 Request.Form或者QueryString会自动使用服务器端指定的编码格式进行解码. 所以需要使用下面的方法自己处理请求,获取参数:
C#代码
- /// <summary>
-
-
-
-
-
- public static NameValueCollection GetRequestParameters(HttpRequest request, string encode)
- {
- NameValueCollection result = null;
- Encoding destEncode = null;
-
-
- if (!String.IsNullOrEmpty(encode))
- {
- try
- {
-
- destEncode = Encoding.GetEncoding(encode);
- }
- catch
- {
-
- destEncode = null;
- }
- }
-
-
- if (request.HttpMethod == "POST")
- {
- if (null != destEncode)
- {
- Stream resStream = request.InputStream;
- byte[] filecontent = new byte[resStream.Length];
- resStream.Read(filecontent, 0, filecontent.Length);
- string postquery = destEncode.GetString(filecontent);
- result = HttpUtility.ParseQueryString(postquery, destEncode);
- }
- else
- {
- result = request.Form;
- }
- }
- else
- {
- if (null != destEncode)
- {
- result = System.Web.HttpUtility.ParseQueryString(request.Url.Query, destEncode);
- }
- else
- {
- result = request.QueryString;
- }
- }
-
-
- return result;
- }
此方法的返回值是一个NameValueCollection集合.客户端实例代码如下:
C#代码
- protected override void OnLoad(EventArgs e)
- {
- string sUrl = String.Empty;
- string tUrl = String.Empty;
- string encoding = String.Empty;
-
- Response.Clear();
-
- try
- {
-
- if (Request.HttpMethod.ToUpper().Trim() == "POST")
- {
- if (!String.IsNullOrEmpty(Request.Form["encoding"]))
- {
- encoding = Request.Form["encoding"].ToUpper();
- }
- }
- else
- {
- if (!String.IsNullOrEmpty(Request.QueryString["encoding"]))
- {
- encoding = Request.QueryString["encoding"].ToUpper();
- }
- }
-
-
- NameValueCollection paramList = EncodeUtility.GetRequestParameters(Request, encoding);
-
-
- sUrl = paramList["surl"];
- tUrl = paramList["turl"];
-
-
- if ( !( String.IsNullOrEmpty(sUrl) && String.IsNullOrEmpty(tUrl) ) )
- {
- Response.Write(OrderFromBL.OrderFromAnalysis(sUrl, tUrl));
- }
- }
- catch(Exception ex)
- {
- WebLog.CommentLog.CommonLogger.Error("OrderFromAjaxProxy.aspx页发生错误", ex);
- }
-
- Response.End();
- }
如果没有传入encoding参数,则使用服务器端默认的编码方式.
[总结]
两种解决方案首先都是要做到避免使用浏览器的中文自动编码, 中文参数一定要先编码再传递. 同时统一客户端和服务器端的编码格式.
[知识扩展]
[浏览器端的编码方式]
Get:
对于Get方式发送的请求, 不同的浏览器使用不同的编码方式自动为中文参数编码.比如:Firefox/3.0.5 使用UTF-8, IE6使用GB2312.
Post:
对于Post方式发送的 请求, 表单中的参数值对是通过request body发送给服务器,此时浏览器会根据网页的ContentType("text/html; charset=GBK")中指定的编码进行对表单中的数据进行编码,然后发给服务器。在HTML代码的Head中添加:
<meta http-equiv="Content-Type" content="text/html;charset=gb2312" />
Firefox/3.0.5 会使用根据charset中设置的编码格式编码post的中文参数.
IE6不起作用.
实验表明使用客户端浏览器默认编码格式具有不确定性.所以传递中文时我们要手工编码参数.
[Javascrip中的编码]
Javascrip语言中编码解码相关的方法主要有:
函数名称
|
函数说明
|
解释
|
escape()
|
escape() 函数可对字符串进行编码,这样就可以在所有的计算机上读取该字符串。
|
该方法不会对 ASCII 字母和数字进行编码,也不会对下面这些 ASCII 标点符号进行编码: - _ . ! ~ * ' ( ) 。其他所有的字符都会被转义序列替换。
[已过时] 请使用 encodeURI() 或 encodeURIComponent()
|
unescape()
|
unescape() 函数可对通过 escape() 编码的字符串进行解码。
|
该函数的工作原理是这样的:通过找到形式为 %xx 和 %uxxxx 的字符序列(x 表示十六进制的数字),用 Unicode 字符 \u00xx 和 \uxxxx 替换这样的字符序列进行解码。
[已过时] 请使用 decodeURI() 或 decodeURIComponent()
|
encodeURI()
|
encodeURI() 函数可把字符串作为 URI 进行编码。
|
该方法不会对 ASCII 字母和数字进行编码,也不会对这些 ASCII 标点符号进行编码: - _ . ! ~ * ' ( ) 。
该方法的目的是对 URI 进行完整的编码,因此对以下在 URI 中具有特殊含义的 ASCII 标点符号,encodeURI() 函数是不会进行转义的:;/?:@&=+$,#
[提示] 如果 URI 的参数中含有不能转移的字符,则应当使用 encodeURIComponent() 方法分别对各参数进行编码。
|
decodeURI()
|
decodeURI() 函数可对 encodeURI() 函数编码过的 URI 进行解码。
|
|
encodeURIComponent()
|
encodeURIComponent() 函数可把字符串作为 URI 组件进行编码。
|
该方法不会对 ASCII 字母和数字进行编码,也不会对这些 ASCII 标点符号进行编码: - _ . ! ~ * ' ( ) 。
其他字符(比如 :;/?:@&=+$,# 这些用于分隔 URI 组件的标点符号),都是由一个或多个十六进制的转义序列替换的。
[提示] 此方法会编码URI中的特殊字符
|
decodeURIComponent()
|
decodeURIComponent() 函数可对 encodeURIComponent() 函数编码的 URI 进行解码。
|
|
举例
document.write(encodeURIComponent("http://www.w3school.com.cn")+ "<br />")
document.write(encodeURI("http://www.w3school.com.cn")+ "<br />")
结果
http%3A%2F%2Fwww.w3school.com.cn
http://www.w3school.com.cn
总结
对于一个URI(URL也是一中URI),如果我们希望将它作为完整的网址发送请求, 但是上面带有中文, 则应该使用encodeURI方法.
如果是要编码参数,则应该使用encodeURIComponent.
Tags: 编码, get, post, 方案
PHP | 评论:0
| 阅读:25497
Submitted by gouki on 2009, January 15, 11:42 AM
不知道你的函数在哪里被调用了?没关系。。
不知道你的函数在哪行?哪个方法?哪个参数里被触发?没关系。
请使用 debug_backtrace函数吧。
呵呵,好象广告一样。
看到这个函数,其实是有点意外的,本来是想好好的做一个LOG,然后想用个观察者模式,最初的发现是,如果我不主动将行数、函数名放进参数里,那就很难在处理的时候,得到这些信息,可以让我快带定位。
结果就看到了这个函数:debug_backtrace();
Table 1. Possible returned elements from debug_backtrace()
Name |
Type |
Description |
function |
string |
The current function name. See also __FUNCTION__. |
line |
integer |
The current line number. See also __LINE__. |
file |
string |
The current file name. See also __FILE__. |
class |
string |
The current class name. See also __CLASS__ |
object |
object |
The current object. |
type |
string |
The current call type. If a method call, "->" is returned. If a static method call, "::" is returned. If a function call, nothing is returned. |
args |
array |
If inside a function, this lists the functions arguments. If inside an included file, this lists the included file name(s). |
Tags: php, debug, trace
PHP | 评论:1
| 阅读:24359
Submitted by gouki on 2009, January 12, 12:26 PM
原作者:冰山上的播客
看到这篇文章的时候,很是惊讶原作者的耐心,虽然我们在平时用的也有一些,但没有作者列出来的全,写excel的时候,我用过pear的库,也用过pack压包的头,同样那些利用smarty等作的简单替换xml的也用过,csv的就更不用谈了。呵呵。(COM方式不讲了,这种可读的太多了,我也写过利用wps等进行word等的生成之类的文章 )
但是在读的时候,只用过一种,具体是什么忘了,要回去翻代码了。因为采用的是拿来主义,记不住。
原文地址:http://xinsync.xju.edu.cn/index.php/archives/3858
原文内容:
最近因项目需要,需要开发一个模块,把系统中的一些数据导出成Excel,修改后再导回系统。就趁机对这个研究了一番,下面进行一些总结。
基本上导出的文件分为两种:
1:类Excel格式,这个其实不是传统意义上的Excel文件,只是因为Excel的兼容能力强,能够正确打开而已。修改这种文件后再保存,通常会提示你是否要转换成Excel文件。
优点:简单。
缺点:难以生成格式,如果用来导入需要自己分别编写相应的程序。
2:Excel格式,与类Excel相对应,这种方法生成的文件更接近于真正的Excel格式。
如果导出中文时出现乱码,可以尝试将字符串转换成gb2312,例如下面就把$yourStr从utf-8转换成了gb2312:
$yourStr = mb_convert_encoding(”gb2312″, “UTF-8″, $yourStr);
【有网友指出上面的转换是错误的,确实,上面的参数顺序是iconv函数的,$yourStr应该是第一个参数。】
下面详细列举几种方法。
一、PHP导出Excel
1:第一推荐无比风骚的PHPExcel,官方网站: http://www.codeplex.com/PHPExcel
导入导出都成,可以导出office2007格式,同时兼容2003。
下载下来的包中有文档和例子,大家可以自行研究。
抄段例子出来:
PHP代码
- <?php
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
- error_reporting(E_ALL);
-
-
- set_include_path(get_include_path() . PATH_SEPARATOR . ‘../Classes/’);
-
-
- include ‘PHPExcel.php’;
-
-
- include ‘PHPExcel/Writer/Excel2007.php’;
-
-
- echo date(’H:i:s’) . ” Create new PHPExcel object\n”;
- $objPHPExcel = new PHPExcel();
-
-
- echo date(’H:i:s’) . ” Set properties\n”;
- $objPHPExcel->getProperties()->setCreator(”Maarten Balliauw”);
- $objPHPExcel->getProperties()->setLastModifiedBy(”Maarten Balliauw”);
- $objPHPExcel->getProperties()->setTitle(”Office 2007 XLSX Test Document”);
- $objPHPExcel->getProperties()->setSubject(”Office 2007 XLSX Test Document”);
- $objPHPExcel->getProperties()->setDescrīption(”Test document for Office 2007 XLSX, generated using PHP classes.”);
- $objPHPExcel->getProperties()->setKeywords(”office 2007 openxml php”);
- $objPHPExcel->getProperties()->setCategory(”Test result file”);
-
-
- echo date(’H:i:s’) . ” Add some data\n”;
- $objPHPExcel->setActiveSheetIndex(0);
- $objPHPExcel->getActiveSheet()->setCellValue(’A1′, ‘Hello’);
- $objPHPExcel->getActiveSheet()->setCellValue(’B2′, ‘world!’);
- $objPHPExcel->getActiveSheet()->setCellValue(’C1′, ‘Hello’);
- $objPHPExcel->getActiveSheet()->setCellValue(’D2′, ‘world!’);
-
-
- echo date(’H:i:s’) . ” Rename sheet\n”;
- $objPHPExcel->getActiveSheet()->setTitle(’Simple’);
-
-
- $objPHPExcel->setActiveSheetIndex(0);
-
-
- echo date(’H:i:s’) . ” Write to Excel2007 format\n”;
- $objWriter = new PHPExcel_Writer_Excel2007($objPHPExcel);
- $objWriter->save(str_replace(’.php’, ‘.xlsx’, __FILE__));
-
-
- echo date(’H:i:s’) . ” Done writing file.”;
2、使用pear的Spreadsheet_Excel_Writer类
下载地址: http://pear.php.net/package/Spreadsheet_Excel_Writer
此类依赖于OLE,下载地址:http://pear.php.net/package/OLE
需要注意的是导出的Excel文件格式比较老,修改后保存会提示是否转换成更新的格式。
不过可以设定格式,很强大。
PHP代码
- <?php
- require_once ‘Spreadsheet/Excel/Writer.php’;
-
-
- $workbook = new Spreadsheet_Excel_Writer();
-
-
- $workbook->send(’test.xls’);
-
-
- $worksheet =& $workbook->addWorksheet(’My first worksheet’);
-
-
- $worksheet->write(0, 0, ‘Name’);
- $worksheet->write(0, 1, ‘Age’);
- $worksheet->write(1, 0, ‘John Smith’);
- $worksheet->write(1, 1, 30);
- $worksheet->write(2, 0, ‘Johann Schmidt’);
- $worksheet->write(2, 1, 31);
- $worksheet->write(3, 0, ‘Juan Herrera’);
- $worksheet->write(3, 1, 32);
-
-
- $workbook->close();
- ?>
3:利用smarty,生成符合Excel规范的XML或HTML文件
支持格式,非常完美的导出方案。不过导出来的的本质上还是XML文件,如果用来导入就需要另外处理了。
详细内容请见rardge大侠的帖子:http://bbs.chinaunix.net/viewthread.php?tid=745757
需要注意的是如果导出的表格行数不确定时,最好在模板中把”ss:ExpandedColumnCount=”5″ ss:ExpandedRowCount=”21″”之类的东西删掉。
4、利用pack函数打印出模拟Excel格式的断句符号,这种更接近于Excel标准格式,用office2003修改后保存,还不会弹出提示,推荐用这种方法。
缺点是无格式。
PHP代码
- <?php
-
- header(”Pragma: public”);
- header(”Expires: 0″);
- header(”Cache-Control: must-revalidate, post-check=0, pre-check=0″);
- header(”Content-Type: application/force-download”);
- header(”Content-Type: application/octet-stream”);
- header(”Content-Type: application/download”);;
- header(”Content-Disposition: attachment;filename=test.xls “);
- header(”Content-Transfer-Encoding: binary “);
-
-
- xlsBOF();
- xlsWriteLabel(1,0,”My excel line one”);
- xlsWriteLabel(2,0,”My excel line two : “);
- xlsWriteLabel(2,1,”Hello everybody”);
-
- xlsEOF();
-
- function xlsBOF() {
- echo pack(”ssssss”, 0×809, 0×8, 0×0, 0×10, 0×0, 0×0);
- return;
- }
- function xlsEOF() {
- echo pack(”ss”, 0×0A, 0×00);
- return;
- }
- function xlsWriteNumber($Row, $Col, $Value) {
- echo pack(”sssss”, 0×203, 14, $Row, $Col, 0×0);
- echo pack(”d”, $Value);
- return;
- }
- function xlsWriteLabel($Row, $Col, $Value ) {
- $L = strlen($Value);
- echo pack(”ssssss”, 0×204, 8 + $L, $Row, $Col, 0×0, $L);
- echo $Value;
- return;
- }
- ?>
- 不过笔者在64位linux系统中使用时失败了,断句符号全部变成了乱码。
-
- 5、使用制表符、换行符的方法
- 制表符”\t”用户分割同一行中的列,换行符”\t\n”可以开启下一行。
- <?php
- header(”Content-Type: application/vnd.ms-execl”);
- header(”Content-Disposition: attachment; filename=myExcel.xls”);
- header(”Pragma: no-cache”);
- header(”Expires: 0″);
-
- echo “hello”.”\t”;
- echo “world”.”\t”;
- echo “\t\n”;
-
-
- echo “this is second line”.”\t”;
- echo “Hi,pretty girl”.”\t”;
- echo “\t\n”;
- ?>
6、使用com
如果你的PHP可以开启com模块,就可以用它来导出Excel文件
PHP代码
- <?PHP
- $filename = “c:/spreadhseet/test.xls”;
- $sheet1 = 1;
- $sheet2 = “sheet2″;
- $excel_app = new COM(”Excel.application”) or Die (”Did not connect”);
- print “Application name: {$excel_app->Application->value}\n” ;
- print “Loaded version: {$excel_app->Application->version}\n”;
- $Workbook = $excel_app->Workbooks->Open(”$filename”) or Die(”Did not open $filename $Workbook”);
- $Worksheet = $Workbook->Worksheets($sheet1);
- $Worksheet->activate;
- $excel_cell = $Worksheet->Range(”C4″);
- $excel_cell->activate;
- $excel_result = $excel_cell->value;
- print “$excel_result\n”;
- $Worksheet = $Workbook->Worksheets($sheet2);
- $Worksheet->activate;
- $excel_cell = $Worksheet->Range(”C4″);
- $excel_cell->activate;
- $excel_result = $excel_cell->value;
- print “$excel_result\n”;
- #To close all instances of excel:
- $Workbook->Close;
- unset($Worksheet);
- unset($Workbook);
- $excel_app->Workbooks->Close();
- $excel_app->Quit();
- unset($excel_app);
- ?>
一个更好的例子: http://blog.chinaunix.net/u/16928/showart_387171.html
一、PHP导入Excel
1:还是用PHPExcel,官方网站: http://www.codeplex.com/PHPExcel。
2:使用PHP-ExcelReader,下载地址: http://sourceforge.net/projects/phpexcelreader
举例:
PHP代码
- <?php
- require_once ‘Excel/reader.php’;
-
-
- $data = new Spreadsheet_Excel_Reader();
-
-
- $data->setOutputEncoding(’utf8′);
-
- $data->read(’ jxlrwtest.xls’);
-
- error_reporting(E_ALL ^ E_NOTICE);
-
- for ($i = 1; $i <= $data->sheets[0]['numRows']; $i++) {
- for ($j = 1; $j <= $data->sheets[0]['numCols']; $j++) {
- echo “\”".$data->sheets[0]['cells'][$i][$j].”\”,”;
- }
- echo “\n”;
- }
-
- ?>
Tags: php, excel, 转摘
PHP | 评论:3
| 阅读:46289
Submitted by gouki on 2009, January 10, 10:22 AM
什么是接口 (interface) ?
接口是方法的抽象,如果不同的类有同样的方法,那么就应该考虑使用接口。
(1)接口是一个行为的规范、协议。其实就是类和类之间的一种协定,一种约束
(2)C#不支持多继承,但是他把这个功能交给接口来实现。
(3)类与类之间的系统资源调用方式不一样,导致他们之间的通信很困难,而接口可以屏蔽掉它们之间的差异,能使他们顺利通信。
什么是抽象类(abstract class)?
1. 抽 象类仅提供一个类型的部分实现。抽象类可以有实例变量,以及一个或多个构造函数。抽象类可以同时有抽象方法和具体方法。一个抽象类不会有实例,这些构造函 数不能被客户端调用来创建实例。一个抽象类的构造函数可以被其子类调用,从而使一个抽象类的所有子类都可以有一些共同的实现,而不同的子类可以在此基础上 有其自己的实现。
2. 抽象类的用途1) 具体类不是用来继承的。 Scott Meyers曾指出,只要有可能,不要丛具体类继承。2) 假设有2个具体类,类A和类B,类B是类A 的子类,那么一个最简单的修改方案是应当建立一个抽象类(或java接口)C,然后让类A和类B成为抽象类C的子类。3) 抽象类应当拥有尽可能多的共同代码。以提高代码的复用率。4) 抽象类应当拥有尽可能少的数据。
3. 基于抽象类的模式和原则1) 针对抽象编程,不要针对具体编程。2) 尽量使用合成(Composition),而不要使用继承来达到复用的目的。3) 使用摸板方法模式
4. 什么时候应当使用继承复用1) 子类是超类的一个特殊种类,而不是超类的一个角色,也就是要区分”is – a” 和“has-a”两种关系。2) 永远不会出现需要将子类换成另一个子类的情况。如果设计师不是很肯定一个类回不会在将来变成另一个类的子类的话,就不应当把这个类设计成这个超类的子类。 3) 子类具有扩展超类的责任,而不是具有置换掉(Override)或注销掉(Nullify)超类的责任。4) 只有在分类学上有意义时,才可以使用继承,不要丛工具类继承。
抽象方法是必须实现的方法。且只能在抽象类中。
接口与抽象类
一个类可以继承多个接口。。。
一个类只能继承一个抽象类。。。
抽象方法是必须实现的方法。就象动物都要呼吸。但是鱼用鳃呼吸,猪用肺呼吸。
动物类要有呼吸方法。怎么呼吸就是子类的事了。
现在有很多讨论和建议提倡用interface代替abstract类,两者从理论上可以做一般性的混用,但是在实际应用中,他们还是有一定区别的。抽象类一般作为公共的父类为子类的扩展提供基础,这里的扩展包括了属性上和行为上的。而接口一般来说不考虑属性,只考虑方法,使得子类可以自由的填补或者扩展接口所定义的方法,就像JAVA王子所说的事件中的适配器就是一个很好的应用。
用一个简单的例子,比如说一个教师,我们把它作为一个抽象类,有自己的属性,比如说年龄,教育程度,教师编号等等,而教师也是分很多种类的,我们就可以继承教师类而扩展特有的种类属性,而普遍属性已经直接继承了下来。
而接口呢~还是拿教师做例子,教师的行为很多,除了和普通人相同的以外,还有职业相关的行为,比如改考卷,讲课等等,我们把这些行为定义成无body的方 法,作为一个集合,它是一个interface。而教师张三李四的各自行为特点又有不同,那么他们就可以扩展自己的行为body。从这点意义上来说,interface偏重于行为。
总之,在许多情况下,接口确实可以代替抽象类,如果你不需要刻意表达属性上的继承的话。
原文:http://www.cnblogs.com/cyc09156/archive/2009/01/09/1372330.html
Tags: 接口, 抽象, interface, abstract
PHP | 评论:1
| 阅读:21844
Submitted by gouki on 2009, January 5, 3:06 PM
simplexml函数是PHP5推出的一个新的类库,可以让你很方便的操作XML,对大多数人而言,最常用的应该是simplexml_load_file和simple_load_string两种了。
但是在使用中总会有一点问题,于是做了简单的一些测试。
建立了四个文件,两个GBK,两个UTF8,
两个GBK的文件内容分别如下:
XML/HTML代码
- <?xml version="1.0" encoding="gbk" ?>
- <test>
- <test1>this is a test中文</test1>
- </test>
XML/HTML代码
- <?xml version="1.0" encoding="utf-8" ?>
- <test>
- <test1>this is a test中文</test1>
- </test>
正如你们想的那样,UTF8的文件也是这些内容。
然后开始使用 simplexml_load_file进行测试:
PHP代码
- <?php
- $xmlFile = '1.txt';
-
- $xml = @simplexml_load_file( $xmlFile );
- if ( $xml === false ){
- echo( 'failed' );
- }else{
- echo '<pre>';
- print_r( $xml );
- echo '</pre>';
- }
-
- ?>
然后,你会发现什么?
1、如果xml的encoding与文件类型不符,立刻报错
2、simplexml可以处理gbk的XML,即文件内容和encoding都为gbk(ANSI格式)
3、不管文件内容是什么,处理完了,都是UTF8.
over,测试完毕
其实想这个测试还有另外一个原因,因为thinkPHP的模版引擎的自定义扩展是采用XML来实现的,以前很多朋友在扩展的时候都会报错,那时候,我们的提示是:请使用 UTF8格式创建XML,现在,我们又可以提示:随便你想怎么创建,只要您的文件格式和encoding一致就行。
Tags: simplexml, test, utf-8, gbk
PHP | 评论:0
| 阅读:22469