语言不行数量~说说Hadoop

File:      W32TextI.txt
Name:      Win32文书信息处理导航
Author:    zyl910
Version:   V1.2
Updata:    2006-5-31

Hadoop是一个是因为Apache基金会所付出的分布式系统基础架构。

  从Windows
2000方始,Windows系统对Unicode多语言支持性非常好,有为数不少强API。

用户可于匪了解分布式底层细节的景下,开发分布式程序。充分利用集群的威力进行快捷运算和储存。

API函数集

 Hadoop实现了一个分布式文件系统(Hadoop Distributed File
System),简称HDFS。HDFS有高容错性的特色,并且计划用来配置于物美价廉的(low-cost)硬件及;而且它提供高吞吐量(high
throughput)来走访应用程序的多少,适合那些具有超大数据集(large data
set)的应用程序。HDFS放宽了(relax)POSIX的求,可以以流的花样拜访(streaming
access)文件系统中的数。


National Language Support  
本地语言支持。用Locale概念来管理不同文化的数值、货币、日期时间等本地文化特性。  
Windows 95、Windows NT 3.5

Unicode and Character Sets  
Unicode字符集函数。使用CodePage概念将不同编码的多字节字符串与Unicode字符串进行转换。  
Windows 95、Windows NT 3.5

Multilingual User Interface  
多语言用户界面。The Multilingual User Interface allows applications to
separate language-specific resources from language-neutral code for
supported user interface languages. This overview describes the
Multilingual User Interface and explains how to use it in your
applications.  
Windows Vista内置,Windows 2000以上可以安装支持包  
MSDN:
<http://msdn.microsoft.com/library/en-us/intl/mui_entry.asp?frame=true>

Fonts and Text  
(GDI)字体与文本。提供了基本的字体与文本排版功能。  
Windows 95、Windows NT 3.5

Font Embedding  
(GDI)字体嵌入。从OpenType字库得到Unicode排版的许多细节信息。  
Windows 98、Windows 2000

Uniscribe  
Unicode复杂文本排版。专用用来处理Unicode复杂文本排版,如西方语言的组合、预构字符、阿拉伯语的双向文本排版……  
IE 5.0,Windows 2000内置。

Keyboard Layout  
键盘布局。处理西方字符,只是一个简单的键盘按键映射机制。  
Windows 95、Windows NT 4.0

Input Method Manager  
输入法管理。与输入法沟通的API。  
Windows95只支持ANSI,Windows 98、Windows NT 4.0是ANSI、Unicode都支持

Text Services Framework  
文本服务框架。处理键盘、输入法、手写、语音输入的通用框架。  
Windows XP内置,但其它平台可以安装TSF支持包。

Active Input Method Manager  
活动输入法管理。IE提供的的输入法管理增强型解口,比如在简体中文Win98平台下可以在IE中使用仓颉输入法。  
IE 4.0

MLang  
多语言。IE中用到的一套多语言编码转换API。  
IE 4.0


这些API的具体使用请查看MSDN:<http://msdn.microsoft.com>

 

书籍推荐

Hadoop的框架最中心之宏图虽是:HDFS和MapReduce。HDFS为海量的多少提供了蕴藏,则MapReduce为海量的多寡提供了匡。

国际化软件开发(原题第2版本)
http://www.china-pub.com/computers/common/info.asp?id=14172
  【原书名】 Developing International Software,Second Edition
  【原出版社】 Microsoft Press 
  【作者】 (美)Dr.International 
  【译者】 沈凤 
  【丛书名】 微软公司核心技术书库 
  【出版社】 机械工业出版社  【书号】 7-111-12482-0
  【开本】 16开 【页码】 357
  【出版日期】 2003-8-1  【版次】 2-1 

优点

Hadoop是一个力所能及针对大量多少开展分布式处理的软件框架。 Hadoop
因相同种植保险、高效、可伸缩的法子开展数据处理。

Hadoop
是保险的,因为它们假设计算元素和存储会失败,因此它保护多只办事多少副本,确保能够针对破产的节点重新分布处理。

Hadoop 是迅速的,因为她为互的措施工作,通过并行处理加快处理速度。

Hadoop 还是只是伸缩的,能够处理 PB 级数据。

此外,Hadoop 依赖让社区服务,因此其的工本较小,任何人都可以使用。

Hadoop是一个会被用户轻松架构和应用的分布式计算平台。用户可以轻松地于Hadoop上开以及运行处理海量数据的应用程序。它要有以下几个长:

  1. 高可靠性。Hadoop按个存储和拍卖多少的力量值得人们相信。

  2. 大扩展性。Hadoop是于可用之电脑集簇间分配数据并就计算任务之,这些集簇可以一本万利地扩展至数以千计的节点受到。

  3. 高效性。Hadoop能够在节点内动态地运动数据,并包各个节点的动态平衡,因此处理速度非常快。

  4. 高容错性。Hadoop能够活动保存数据的差不多个副本,并且能够自动将败的天职重新分配。

  5. 低成本。与一体机、商用数据仓库以及QlikView、Yonghong
    Z-Suite等数会相比,hadoop是开源的,项目之软件成本因此会大大降低。

Hadoop带有用Java语言编写的框架,因此运行在 Linux
生产平台达成是充分优良的。Hadoop 上的应用程序也堪采取外语言编写,比如
C++。

hadoop大数量处理的义

Hadoop得以在大数额处理下中广大应用得益于该本身在数码提取、变
形和加载(ETL)方面达到的先天优势。Hadoop的分布式架构,将老数据处理引擎尽可能的靠近存储,对诸如像ETL这样的批处理操作相对合适,因为接近
这样操作的批处理结果可以一直走向存储。Hadoop的MapReduce功能实现了用单个任务打碎,并以零散任务(Map)发送到几近个节点上,之后再行为
单个数据集的款型加载(Reduce)到数据仓库里。

 

子项目

Hadoop Common:
在0.20和以前的版本被,包含HDFS、MapReduce和其它类别集体内容,从0.21发端HDFS和MapReduce被分别也单独的子项目,其余内容吧Hadoop
Common

HDFS: Hadoop分布式文件系统(Distributed File System) - HDFS (Hadoop
Distributed File System)

MapReduce:并行计算框架,0.20前方应用 org.apache.hadoop.mapred
旧接口,0.20版开始引入org.apache.hadoop.mapreduce的新API

HBase: 类似Google
BigTable的分布式NoSQL列数据库。(HBase和Avro已经深受2010年5月化世界级
Apache 项目)

Hive:数据仓库工具,由Facebook贡献。

Zookeeper:分布式锁设施,提供类似Google
Chubby的效应,由Facebook贡献。

Avro:新的数序列化格式和传输工具,将逐年替代Hadoop原有的IPC机制。

Pig: 大数量解析平台,为用户提供多种接口。

Ambari:Hadoop管理工具,可以很快的监察、部署、管理集群。

Sqoop:于在HADOOP与习俗的数据库中开展多少的传递。

网址推荐
~~~~

大爷总结

经者相关阅读,让我们掌握到hadoop是一个极大之家伙集,里面来分布式文件存储,并行云计算,分布式事务锁,大数目解析等同样雨后春笋工具,确实够你喝相同壶的!

自然,如果你认为它好,还是越发早迈出第一步越好!

 

http://www.pkucn.com/forumdisplay.php?fid=29
北大中文论坛 www.pkucn.com -> 中文信息处理

http://www.unicode.org/
Unicode组织

http://www.cjk.org/
日中韩辞典研究所

http://www.microsoft.com/globaldev/
微软·国家化开发

http://www.microsoft.com/typography/
微软·字库与排版

http://www.microsoft.com/typography/SpecificationsOverview.mspx
微软·字库与排版·TrueType与OpenType字库标准

发表评论

电子邮件地址不会被公开。 必填项已用*标注

网站地图xml地图