xref: /onnv-gate/usr/src/cmd/perl/5.8.4/distrib/pod/perlcn.pod (revision 0:68f95e015346)
1If you read this file _as_is_, just ignore the funny characters you
2see. It is written in the POD format (see perlpod manpage) which is
3specially designed to be readable as is.
4
5The following documentation is written in EUC-CN encoding.
6
7�������һ������ֱ༭����������ļ�, ������������ص�ע���ַ�.
8����ļ����� POD (�����ļ���ʽ) д��; ���ָ�ʽ��Ϊ��������ֱ���Ķ�,
9���ر���Ƶ�. ���ڴ˸�ʽ�Ľ�һ����Ϣ, ��ο� perlpod �����ļ�.
10
11=head1 NAME
12
13perlcn - �������� Perl ָ��
14
15=head1 DESCRIPTION
16
17��ӭ���� Perl �����!
18
19�� 5.8.0 �濪ʼ, Perl �߱������Ƶ� Unicode (ͳһ��) ֧Ԯ,
20Ҳ����֧Ԯ�����������ϵ����ı��뷽ʽ; CJK (���պ�) �������е�һ����.
21Unicode �ǹ����Եı�׼, ��ͼ�������������е��ַ�: ��������, ��������,
22�Լ����߼��һ�� (ϣ����, ��������, ��������, ϣ������, ӡ����,
23ӡ�ذ���, �ȵ�). ��Ҳ�����˶�����ҵϵͳ��ƽ̨ (�� PC �������).
24
25Perl ������ Unicode ���в���. ���ʾ Perl �ڲ����ַ������ݿ��� Unicode
26��ʾ; Perl �ĺ�ʽ����� (���������ʾʽ�ȶ�) Ҳ�ܶ� Unicode ���в���.
27�����뼰���ʱ, Ϊ�˴����� Unicode ֮ǰ�ı��뷽ʽ��ŵ�����, Perl
28�ṩ�� Encode ���ģ��, �����������׵ض�ȡ��д����еı�������.
29
30Encode ����ģ��֧Ԯ���м������ĵı��뷽ʽ ('gb2312' ��ʾ 'euc-cn'):
31
32    euc-cn	Unix �����ַ���, Ҳ�����׳ƵĹ�����
33    gb2312-raw	δ������� (�ͱ���) GB2312 �ַ���
34    gb12345	δ��������й��÷������ı���
35    iso-ir-165	GB2312 + GB6345 + GB8565 + �����ַ�
36    cp936	����ҳ 936, Ҳ������ 'GBK' (���������) ָ��
37    hz		7 �����ݳ�ʽ GB2312 ����
38
39������˵, �� EUC-CN ����ĵ���ת�� Unicode, �����������ָ��:
40
41    perl -Mencoding=euc-cn,STDOUT,utf8 -pe1 < file.euc-cn > file.utf8
42
43Perl Ҳ�ڸ��� "piconv", һ֧��ȫ�� Perl д�ɵ��ַ�ת�����߳���, �÷�����:
44
45    piconv -f euc-cn -t utf8 < file.euc-cn > file.utf8
46    piconv -f utf8 -t euc-cn < file.utf8 > file.euc-cn
47
48����, ���� encoding ģ��, ���������д�����ַ�Ϊ��λ�ij�����, ������ʾ:
49
50    #!/usr/bin/env perl
51    # ���� euc-cn �ִ�����; ��׼����뼰��׼������Ϊ euc-cn ����
52    use encoding 'euc-cn', STDIN => 'euc-cn', STDOUT => 'euc-cn';
53    print length("����");	     #  2 (˫���ű�ʾ�ַ�)
54    print length('����');	     #  4 (�����ű�ʾ�ֽ�)
55    print index("׻׻�̻�", "�׻�"); # -1 (�����������ַ���)
56    print index('׻׻�̻�', '�׻�'); #  1 (�ӵڶ����ֽڿ�ʼ)
57
58�����һ��������, "׻" �ĵڶ����ֽ��� "׻" �ĵ�һ���ֽڽ�ϳ� EUC-CN
59��� "��"; "׻" �ĵڶ����ֽ����� "��" �ĵ�һ���ֽڽ�ϳ� "��".
60��������ǰ EUC-CN ��ȶԴ����ϳ���������.
61
62=head2 ��������ı���
63
64�����Ҫ��������ı���, ���Դ� CPAN (L<http://www.cpan.org/>) ����
65Encode::HanExtra ģ��. ��Ŀǰ�ṩ���б��뷽ʽ:
66
67    gb18030	�����������, ������������
68
69����, Encode::HanConvert ģ�����ṩ�˼�ת���õ����ֱ���:
70
71    big5-simp	Big5 ���������� Unicode �������Ļ�ת
72    gbk-trad	GBK ���������� Unicode �������Ļ�ת
73
74������ GBK �� Big5 ֮�以ת, ��ο���ģ���ڸ��� b2g.pl �� g2b.pl ��֧����,
75���ڳ�����ʹ������д��:
76
77    use Encode::HanConvert;
78    $euc_cn = big5_to_gb($big5); # �� Big5 תΪ GBK
79    $big5 = gb_to_big5($euc_cn); # �� GBK תΪ Big5
80
81=head2 ��һ������Ϣ
82
83��ο� Perl �ڸ��Ĵ���˵���ļ� (����ȫ����Ӣ��д��), ��ѧϰ�������
84Perl ��֪ʶ, �Լ� Unicode ��ʹ�÷�ʽ. ����, �ⲿ����Դ�൱�ḻ:
85
86=head2 �ṩ Perl ��Դ����ַ
87
88=over 4
89
90=item L<http://www.perl.com/>
91
92Perl ����ҳ (��ŷ����˾ά��)
93
94=item L<http://www.cpan.org/>
95
96Perl �ۺϵ���� (Comprehensive Perl Archive Network)
97
98=item L<http://lists.perl.org/>
99
100Perl �ʵ���̳һ��
101
102=back
103
104=head2 ѧϰ Perl ����ַ
105
106=over 4
107
108=item L<http://www.oreilly.com.cn/html/perl.html>
109
110�������İ��ŷ���� Perl ���
111
112=back
113
114=head2 Perl ʹ���߼���
115
116=over 4
117
118=item L<http://www.pm.org/groups/asia.shtml#China>
119
120�й� Perl �ƹ���һ��
121
122=back
123
124=head2 Unicode �����ַ
125
126=over 4
127
128=item L<http://www.unicode.org/>
129
130Unicode ѧ��ѧ�� (Unicode ��׼���ƶ���)
131
132=item L<http://www.cl.cam.ac.uk/%7Emgk25/unicode.html>
133
134Unix/Linux �ϵ� UTF-8 �� Unicode �����
135
136=back
137
138=head1 SEE ALSO
139
140L<Encode>, L<Encode::CN>, L<encoding>, L<perluniintro>, L<perlunicode>
141
142=head1 AUTHORS
143
144Jarkko Hietaniemi E<lt>jhi@iki.fiE<gt>
145
146Autrijus Tang (���ں�) E<lt>autrijus@autrijus.orgE<gt>
147
148=cut
149