1If you read this file _as_is_, just ignore the funny characters you 2see. It is written in the POD format (see perlpod manpage) which is 3specially designed to be readable as is. 4 5The following documentation is written in EUC-CN encoding. 6 7�������һ������ֱ༭����������ļ�, ������������ص�ע���ַ�. 8����ļ����� POD (�����ļ���ʽ) д��; ���ָ�ʽ��Ϊ��������ֱ���Ķ�, 9���ر���Ƶ�. ���ڴ˸�ʽ�Ľ�һ����Ϣ, ��ο� perlpod �����ļ�. 10 11=head1 NAME 12 13perlcn - �������� Perl ָ�� 14 15=head1 DESCRIPTION 16 17��ӭ���� Perl �����! 18 19�� 5.8.0 �濪ʼ, Perl �߱������Ƶ� Unicode (ͳһ��) ֧Ԯ, 20Ҳ����֧Ԯ�����������ϵ����ı��뷽ʽ; CJK (���պ�) �������е�һ����. 21Unicode �ǹ����Եı�, ��ͼ�������������е��ַ�: ��������, ��������, 22�Լ������һ�� (ϣ����, ��������, ��������, ϣ������, ӡ����, 23ӡ�ذ���, �ȵ�). ��Ҳ�����˶�����ҵϵͳ��ƽ̨ (�� PC �������). 24 25Perl ������ Unicode ���в���. ���ʾ Perl �ڲ����ַ������ݿ��� Unicode 26��ʾ; Perl �ĺ�ʽ����� (���������ʾʽ�ȶ�) Ҳ�ܶ� Unicode ���в���. 27�����뼰���ʱ, Ϊ�˴����� Unicode ֮ǰ�ı��뷽ʽ��ŵ�����, Perl 28�ṩ�� Encode ���ģ��, �����������ض�ȡ��д����еı�������. 29 30Encode ����ģ��֧Ԯ���м������ĵı��뷽ʽ ('gb2312' ��ʾ 'euc-cn'): 31 32 euc-cn Unix �����ַ���, Ҳ�����׳ƵĹ����� 33 gb2312-raw δ������� (�ͱ���) GB2312 �ַ��� 34 gb12345 δ��������й��÷������ı��� 35 iso-ir-165 GB2312 + GB6345 + GB8565 + �����ַ� 36 cp936 ����ҳ 936, Ҳ������ 'GBK' (���������) ָ�� 37 hz 7 �����ݳ�ʽ GB2312 ���� 38 39������˵, �� EUC-CN ����ĵ���ת�� Unicode, �����������ָ��: 40 41 perl -Mencoding=euc-cn,STDOUT,utf8 -pe1 < file.euc-cn > file.utf8 42 43Perl Ҳ�ڸ��� "piconv", һ֧��ȫ�� Perl д�ɵ��ַ�ת�����߳���, �÷�����: 44 45 piconv -f euc-cn -t utf8 < file.euc-cn > file.utf8 46 piconv -f utf8 -t euc-cn < file.utf8 > file.euc-cn 47 48����, ���� encoding ģ��, ���������д�����ַ�Ϊ��λ�ij�����, ������ʾ: 49 50 #!/usr/bin/env perl 51 # ���� euc-cn �ִ�����; ������뼰��������Ϊ euc-cn ���� 52 use encoding 'euc-cn', STDIN => 'euc-cn', STDOUT => 'euc-cn'; 53 print length("����"); # 2 (˫���ű�ʾ�ַ�) 54 print length('����'); # 4 (�����ű�ʾ�ֽ�) 55 print index("�̻�", "��"); # -1 (�����������ַ���) 56 print index('�̻�', '��'); # 1 (�ӵڶ����ֽڿ�ʼ) 57 58�����һ��������, "" �ĵڶ����ֽ��� "" �ĵ�һ���ֽڽ�ϳ� EUC-CN 59��� "��"; "" �ĵڶ����ֽ����� "��" �ĵ�һ���ֽڽ�ϳ� "��". 60��������ǰ EUC-CN ��ȶԴ����ϳ���������. 61 62=head2 ��������ı��� 63 64�����Ҫ��������ı���, ���Դ� CPAN (L<http://www.cpan.org/>) ���� 65Encode::HanExtra ģ��. ��Ŀǰ�ṩ���б��뷽ʽ: 66 67 gb18030 ������Ĺ�����, ������������ 68 69����, Encode::HanConvert ģ�����ṩ�˼�ת���õ����ֱ���: 70 71 big5-simp Big5 ���������� Unicode �������Ļ�ת 72 gbk-trad GBK ���������� Unicode �������Ļ�ת 73 74������ GBK �� Big5 ֮�以ת, ��ο���ģ���ڸ��� b2g.pl �� g2b.pl ��֧����, 75���ڳ�����ʹ������д��: 76 77 use Encode::HanConvert; 78 $euc_cn = big5_to_gb($big5); # �� Big5 תΪ GBK 79 $big5 = gb_to_big5($euc_cn); # �� GBK תΪ Big5 80 81=head2 ��һ������Ϣ 82 83��ο� Perl �ڸ��Ĵ���˵���ļ� (����ȫ����Ӣ��д��), ��ѧϰ������� 84Perl ��֪ʶ, �Լ� Unicode ��ʹ�÷�ʽ. ����, �ⲿ����Դ�൱�ḻ: 85 86=head2 �ṩ Perl ��Դ����ַ 87 88=over 4 89 90=item L<http://www.perl.com/> 91 92Perl ����ҳ (��ŷ����˾ά��) 93 94=item L<http://www.cpan.org/> 95 96Perl �ۺϵ���� (Comprehensive Perl Archive Network) 97 98=item L<http://lists.perl.org/> 99 100Perl �ʵ���̳һ�� 101 102=back 103 104=head2 ѧϰ Perl ����ַ 105 106=over 4 107 108=item L<http://www.oreilly.com.cn/html/perl.html> 109 110�������İ��ŷ���� Perl ��� 111 112=back 113 114=head2 Perl ʹ������ 115 116=over 4 117 118=item L<http://www.pm.org/groups/asia.shtml#China> 119 120�й� Perl �ƹ���һ�� 121 122=back 123 124=head2 Unicode �����ַ 125 126=over 4 127 128=item L<http://www.unicode.org/> 129 130Unicode ѧ��ѧ�� (Unicode �����ƶ���) 131 132=item L<http://www.cl.cam.ac.uk/%7Emgk25/unicode.html> 133 134Unix/Linux �ϵ� UTF-8 �� Unicode ����� 135 136=back 137 138=head1 SEE ALSO 139 140L<Encode>, L<Encode::CN>, L<encoding>, L<perluniintro>, L<perlunicode> 141 142=head1 AUTHORS 143 144Jarkko Hietaniemi E<lt>jhi@iki.fiE<gt> 145 146Autrijus Tang (���ں�) E<lt>autrijus@autrijus.orgE<gt> 147 148=cut 149