• ----:)欢迎访问源码网(:----
    • 首页
    • 博客
    • 学院
    • 下载
    • 论坛
    • 影视
    • 发布源码
    • RSS
    • ITPig
    • 笑话网
    • 百家姓
    • 繁體中文

源码网 - 中国第一源码门户
选择镜像:网通镜像 - 电信主站
  • 首 页
  • 新闻动态
  • 网站运营
  • 网页制作
  • WEB开发
  • 编程开发
  • 图像媒体
  • 操作系统
  • 数据库
  • 服务器
热门搜索 优化 SEO 故事 cms IIS7 MySQL 个人 AdSense 主题推广 | 文章搜索: 高级搜索
会员登录/控制面版您的位置: 学院首页 >> 网页制作 >> 基础知识 >> 详细内容
 

推荐文章

 
 

热点文章

  • 网页实用代码
  • 企业网站里的动态 静态之争论
  • 防止表格被撑开或div层被撑开的多种方法
  • 网站设计者:提高网页打开速度的一些小技巧
  • 网站编码对于小语种SEO的重要性
  • http状态码一览表
  • meta标签的功能
  • 各种语言禁止缓存的方法
  • libiconv介绍
 
 

相关文章

 
 

百度搜索

 
 

libiconv介绍

  • 阅览次数:
  • 文章来源: CodePub整理
  • 原文作者:
  • 整理日期: 2008-08-16
  • 发表评论
  • 字体大小:
  • 小
  • 中
  • 大

仍然有在Unicode和其他的传统编码之间转换的需求。GNU的libiconv就是为这两种应用设计的编码转换库。



由于历史原因,国际化的文字常常由于语言或者国家的原因使用不同的编码。随着互联网时代的到来,通过互联网进行文字交流也逐渐增多:浏览外国的网站,这个时候字符编码的转换变得尤为重要。这带来了一个问题,就是许多字符在某一种编码方式中没有。为了解决这种混乱,Unicode的编码方式被建立。 Unicode是一种超级编码包含了所有这些编码的字符集,因此一些新的文本格式像XML的默认编码方式就是Unicode.
但是很多老式的计算机还在使用当地的传统的字符编码方式。而一些程序,例如邮件程序和浏览器必须能在这些不同的用户编码之间作转换。其他的一些程序则内置支持Unicode,以顺利支持国际化的处理,但是仍然有在Unicode和其他的传统编码之间转换的需求。GNU的libiconv就是为这两种应用设计的编码转换库。
详细资料
libiconv库为需要做转换的应用提供了一个iconv()的函数,以实现一个字符编码到另一个字符编码的转换。
包括的编码有:
欧洲语系 ASCII, ISO-8859-{1,2,3,4,5,7,9,10,13,14,15,16}, KOI8-R, KOI8-U, KOI8-RU, CP{1250,1251,1252,1253,1254,1257}, CP{850,866}, Mac{Roman,CentralEurope,Iceland,Croatian,Romania}, Mac{Cyrillic,Ukraine,Greek,Turkish}, Macintosh

犹太语系 ISO-8859-{6,8}, CP{1255,1256}, CP862, Mac{Hebrew,Arabic}

日文 EUC-JP, SHIFT_JIS, CP932, ISO-2022-JP, ISO-2022-JP-2, ISO-2022-JP-1

中文 EUC-CN, HZ, GBK, GB18030, EUC-TW, BIG5, CP950, BIG5-HKSCS, ISO-2022-CN, ISO-2022-CN-EXT

朝鲜文 EUC-KR, CP949, ISO-2022-KR, JOHAB

亚美尼亚语 ARMSCII-8

格鲁尼亚语 Georgian-Academy, Georgian-PS

塔吉克语 KOI8-T

泰国语 TIS-620, CP874, MacThai

老挝语 MuleLao-1, CP1133

越南语 VISCII, TCVN, CP1258

特殊平台 HP-ROMAN8, NEXTSTEP

全部Unicode UTF-8 UCS-2, UCS-2BE, UCS-2LE UCS-4, UCS-4BE, UCS-4LE UTF-16, UTF-16BE, UTF-16LE UTF-32, UTF-32BE, UTF-32LE UTF-7 C99, JAVA

按照uint16_t或uint32_t的全部Unicode(with machine dependent endianness and alignment) UCS-2-INTERNAL, UCS-4-INTERNAL

按照`char\'或`wchar_t\'的某些本地依赖 (with machine dependent endianness and alignment, and with OS and locale dependent semantics) char, wchar_t 犹太语系 空编码名称等价于"char",它不依赖于本地编码

当选择了配置选项 --enable-extra-encodings 以后,会支持下面几种扩展编码:


欧洲语系 CP{437,737,775,852,853,855,857,858,860,861,863,865,869,1125}
犹太语系 CP864
日语 EUC-JISX0213, Shift_JISX0213, ISO-2022-JP-3
土库曼语 TDS565
特殊平台 RISCOS-LATIN1

通过到Unicode的转换,所有这都可以互相转换些编码。
当然这个翻译也有局限性,比如当一个字符在目标的编码里没有的对应字符的时候,转换程序会自动选择一个最相近的。当目标编码前面加上"//TRANSLIT"的时候,转换开始。
libiconv多被用在应用需要多字节编码而目标系统部支持多自己编码的时候。

上一篇:PayPal全中文详解
下一篇:PHP初级程序员面试题及答案
  • 网友评论:
  • 查看所有评论
  • 我要发表评论
您的网名:
留言主题:
你要发表的内容:

 

关于本站 | 广告联系 | 版权声明 | 网站地图 | 发布软件 | 帮助中心 | 源码论坛

Copyright © 2005-2007 CodePub.Com  程序支持:木翼  滇ICP备05005971号