+系统介绍+
淘特站内搜索引擎是由淘特JSP搜索引擎发展而来,系统基于Lucene.Net核心,通过高效的中文分词算法将数据库中内容进行分析、索引并保存至硬盘中。前台搜索时,通过读取索引文件查询,避免了传统数据库查询在高并发及海量数据下的性能问题。因前台搜索不在连接数据库,为不希望数据库放到前台的特殊用户群体提供了数据快速查询解决方案。
+安装说明+
本系统使用asp.net+C#开发,系统运行于.net framework2.0以上版本环境中。通过将文件上传到服务器,并开通系统中tot目录everyone读写权限即可完成安装。
+初次索引说明+
如果您的网站已经有一定的数据,可以使用本软件中提供的Reset.aspx连接数据库,选择要索引到搜索引擎的表及相关字段,执行索引后即完成数据库的索引初始化。然后就可以通过http://您的域名/Default.aspx 看到查询效果。
提示!!:完成数据库初始化后,为避免误操作索引,请一定删除或修改Reset.aspx。
+索引接口说明+
虽然数据库的数据已经完成了索引初始化,前台查询也已实现,当网站的数据更新时,如何让淘特站内搜索引擎自动索引新的数据以保证前台永远可以查询到最新的内容?为此我们提供了索引访问接口文件:TotIndex.aspx,该接口提供了索引的添加、删除功能。为避免外站恶意提交非法数据,访问该接口需要通过一个key与其通信,只有key与系统指定的相同时,才能完成索引的添加、删除。该key在Web.config中配置,如下:
<appSettings>
<add key="ikey" value="totsearchengine01"/>
</appSettings>
在系统初次安装后,请将ikey的value部分修改一个比较复杂的字符串。同时在您的索引接口访问时提供相同的key。
索引接口以HTTP方式传输数据。考虑到本软件使用的utf-8编码,某些语言如asp,php,有可能在get提交数据时使用的gb2312编码,如果不进行gb2312对utf-8的转换将会出现乱码现象,另外get方法提交数据也会有数据传输长度限制的问题,因此索引接口我们采用了post方法。为了方便开发者快速入门索引接口的使用,我们制作了不同WEB开发语言(asp,jsp,php,.net)的索引接口开发事例,请参考demo目录中的相关文件。
索引接口开发完毕后,通过修改您原来的数据添加程序,在添加数据库后,执行一下索引接口程序,就可以同步完成搜索引擎的索引自动添加。实现了站内搜索引擎的实时更新。
更新说明(2010-5-10):
1、优化索引,提高批量更新索引效率
2、优化搜索,200万数量下搜索时间为1秒之内
3、提供gb2312编码的搜索接口(Default_GbK.aspx),解决使用gb2312的网站中,集成搜索表单,提交后乱码的问题。
4、提供DEDE,帝国,动易最新CMS版本的搜索引擎整合说明及代码。
更新说明(2010-5-4):
1、增加搜索结果关键字高亮显示
2、修改输入空格时出错的问题
3、修改索引接口不能支持 HTML 文档的BUG
4、初始化数据库索引时,增加悬浮提示。
5、修改搜索用时为两位小数
游客
非常好 2009-11-22