湘里妹子学术网

 找回密码
 注册
查看: 7805|回复: 5

文档转换引擎(新)

[复制链接]
发表于 2004-8-27 10:34:55 | 显示全部楼层 |阅读模式
大幅度提升Html转换TXT文档精度
增加PDF加密文档文本提取模块

doc2txt windows版本提供下载

一、引擎介绍:

1、pdf 、word 、excel、eml、ps、ppt、html 转换到纯文本
2、转换方式:纯文档格式分析(并非使用windows ole方式)
3、现在支持语言种类:中文gbk big5 、韩文、日文、英文
4、编程语言:C/C++ Perl
5、适用操作系统:FreeBSD、LINUX 、SUN Solaris 、WINDOWS
6、占用系统资源:非常少,大大优于windows ole 方式
7、转换效率:高于 windows OLE 方式,效率约为OLE 5-10倍。
8、稳定性:由于使用文档格式分析,不调用任何接口程序,稳定性极佳。
9、支持API 接口调用

二、应用领域:

1、各类文档转换入库
2、各种文档转换输出
3、各类文档全文检索

三、使用方法和注意事项:

1、将需要转换的文档上传至服务器,上传完毕后服务器将进行转换并输出文本文件连接。
2、转换引擎使用统一接口,自动分析文档格式,目前支持格式(WORD、EXCEL、PPT、PDF、HTML、EMAIL、RTF、PS)
3、转换引擎不能转换加密、损坏、图片转换和非标准文档。

四、转换例子和演示:

===在线转换演示===




五、演示系统软、硬件信息:

硬件:CPU PIII 800    硬盘:IDE 40G    内存:512M
软件:FreeBSD 4.7
发表于 2004-8-27 11:42:32 | 显示全部楼层
Great!
发表于 2004-9-1 14:58:45 | 显示全部楼层
一、能否Convert成HTM格式?
二、對應字庫是否有缺字?要檢查。
三、測量同時多客戶使用時對Server Cpu 運算能力的影響(尤其在Win2000系統)

David君可跟adobe公司談談和Demo你的作品。他們的的線上轉換服務在:
(Adobe PDF Conversion)
http://access.adobe.com/simple_form.html
目前仍無法解析亞洲語系(CJKV);所以他們應會有興趣。

目前在Internet上提供類似公眾服務的程式都要錢,而且目前只看到轉換西文的,都不能支持CJKV。但他們是轉成HTM的。
所以David君的這轉換程式,是已經具有商業價值的,希望再努力!
 楼主| 发表于 2004-9-3 17:38:54 | 显示全部楼层

a

分析的很透彻呀!哦正在找投资呢!或者软件开发商进行合作。有这方面渠道吗?
发表于 2004-9-3 20:06:31 | 显示全部楼层

告诉david一个秘密(不能告诉别人)

-------------------------------------------------------
Artvine版主就是最好的“渠道”呢:cool:
david您赶紧请湘里妹子站长给您做中介人好了

努力加油哟david
肯定能成交的:happy:

顺便给david提个醒
成交后可千万不能忘了一点
是湘里妹子学术论坛给您拉的皮条哦
中介人只是收点儿”皮条费“作为论坛的基本建设资金而已:wink:
有福共享见者有份嘛
不算过分吧嘿嘿:ninja:

真有意的话请及时跟站长联络
机不可失时不再来的啦c00|
 楼主| 发表于 2004-9-3 22:08:45 | 显示全部楼层
Artvine 于 2004-9-1 14:58 写道:
一、能否Convert成HTM格式?
二、對應字庫是否有缺字?要檢查。
三、測量同時多客戶使用時對Server Cpu 運算能力的影響(尤其在Win2000系統)

David君可跟adobe公司談談和Demo你的作品。他們的的線上轉換服務在 ...


目前做的是“文档转换引擎“  提供转换基础件、和中间件。基础件对多线程多进程支持效果最好

Active 如果有这方面合作渠道可以给介绍一下,由衷感谢。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|湘里妹子学术网 ( 粤ICP备2022147245号 )

GMT++8, 2024-4-29 18:21 , Processed in 0.071835 second(s), 16 queries .

Powered by Discuz! X3.4

Copyright © 2001-2023, Tencent Cloud.

快速回复 返回顶部 返回列表