| All Our N-gram are Belong to You | Google Shares Click Fraud Stats |
| Only 11 Percent Of Searchers Use One Word Queries | Site Level Noise Removal for Search Engines |
| Topical TrustRank: using Topicality to Combat web Spam | Toward Tighter Integration of Web Search with a Geographi... |
| CWS: A Comparative Web Search System | Searching with Context |
| Retroactive Answering of Search Queries | Automatic Identification of User Interest For Personalize... |
| Beyond PageRank: Machine Learning for Static Ranking | 互联网搜索的未来 |
| 第四代搜索引擎试敲收费大门 TMT最具投资价值 | 微软卡位第三代搜索技术 认为Google将很快过时 |
| Google Patent Filings by the Dozen | 百度数分钟内闪电裁员 企业软件事业部遭抛弃 |
| Different Criteria for Different Search Engines: SES Latino | SES Speaker: Not All Links Are Equal |
| 国家版权局版权司副司长许超:关于搜索引擎的侵权问题 | 信息时代信息焦虑 搜索引擎:大脑的延伸 |
| 下一代搜索引擎 | 网络公司获青睐 互联网企业首获建博士后工作站 |
| 博客与搜索引擎将成我国互联网治理新重点 | 百度获准建博士后工作站,李彦宏等人成博导 |
| 国内中文搜索引擎比较研究 | New Players in Travel Search |
| Search Influences Consumers Medical Decisions | Pay-per-text: The Next Frontier? |
| Who′s Who in Local Search | What is the Local Search Guide |
| 百度CTO刘建国:在Google上不去的日子 | retrievr: Image Search by Color and Pattern |
| The Anatomy of a Large-Scale Hypertextual Web Search Engine | Crawling the Hidden Web |
| Parallel Crawlers | Google predicts India will be largest net market |
| Guarding Google′s Data Banks | 什么是不可见网页(deep web ) |
| In search of the deep Web(2) | The Deep Web: Surfacing Hidden Value |
| In search of the deep Web | Google Launches Co-op Search; Reaffirms Online and Offlin... |
| Microsoft Launches Competitor To Google Scholar | Why Search Rules DO Work |
| 什么是PageRank?(关于Page Rank的介绍) | Webaroo offers mini-search |
| 搜索引擎在幕后怎样工作 | 效仿Google 雅虎修改搜索广告排名算法 |
| 战胜雅虎、微软 Google收购先进文本搜索算法 | How Do Search Engines Handle Chinese Queries? |
| 算法是百度工程师的利器 | Pruning Texts with NLP and Expanding Queries with an Onto... |
| Finding What People Want: Experiences with the WebCrawler | Swoogle: A Semantic Web Search Engine |
| 分析:搜索引擎八年后的机会(下) | 分析:搜索引擎八年后的机会(上) |
| WEB超链分析算法 | Ask Jeeves Assimilates Teoma |
| Teoma vs. Google, Round Two | 中文搜索引擎技术揭密:系统架构 |
| THE LINGUIST’S SEARCH ENGINE:G... | Google PageRank 算法解析 |
| Google的PageRank算法学习 | Analysis包分析 |
| 搜索引擎的使用和原理 | Outlook 2006: Web Advertising Alters The Magazine Landscape |
| Local, BTB Search Services Debut at SES Show | 搜索引擎评价指标 |
| 互联网上图像信息检索 | 文本自动分类的基础Term频率计算 |
| Nutch安装笔记 | Page Rank教程 |
| Nutch分布式文件系统 | 搜索引擎中网络爬虫的设计分析 |
| 一个简单的机器人例子(Java) | “看不见的网页” 介绍 |
| 汉字编码问题 | larbin使用说明 |
| 从Larbin看互联网爬虫设计 | Larbin 一种高效的搜索引擎爬虫工具 |
| google搜索原理的论文(二) | google搜索原理的论文(一) |
| 汉语自动分词研究评述 | 自动分词与中文搜索引擎 |
| Ranking Aggregates | Google Lashes Out Against Justice Department Subpoena |
| Online Exclusive: Google Enhances Bidding Controls, But I... | Did You Mean: Lucene? |
| Introduction to Nutch, Part 1: Crawling | Pre-conference Tutorial: Google, Microsoft, Yahoo! SEM 2006 |
| Search Engine Meeting 2006 Presentations | 搜索引擎优化的五大技术难题 |
| 基调系统中国搜索引擎竞争环境调查报告摘要 | “114”变脸“电话搜索引擎” |
| Google:全球最大窥隐癖? | 美责令Google交出用户搜索记录 遭坚决抵制 |
| Google 搜索之 WebService 篇(一) | Google 搜索之 WebService 篇(二) |
| 解析搜索引擎常用的排序技术 | 自己动手做搜索引擎 |
| Hyperlink Analyses of the World Wide Web: A Review | Conclusions |
| Hyperlink Analysis: The Webometrics Approach | A Survey of Hyperlink Network Studies |
| Hyperlink Network Analysis: Theory and Methods | Hyperlink Analysis Approaches From Computer Science and S... |
| 法德不满Google独步市场 联手研发搜索引擎 | Google离线广告进军报纸 拿芝加哥太阳报试水 |
| Java搜索引擎Compass Framework 0.8.... | 微软的第一个搜索技术掌门 |
| 基于Lucene的Mp3检索器 | Google如何实现国际化支持 |
| PHP搜索引擎技术核心揭密 | 构建使用 Google API 的 Java 应用程序总结(... |
| Google API 直接使用Web服务(7) | Google API拼写检查器和缓存页面(6) |
| Google API筛选结果(5) | Google API搜索结果(4) |
| Google API创建搜索 | 什么是google API(2) |
| Google API简介(1) | 企业级搜索 春色撩人 |
| 图像搜索引擎问世 搜索不必使用关键词 | IBM公布UIMA模式 欲领跑第3代智能搜索市场 |
| GOTOTEL首创电话搜索 引爆搜索经济新商机 | 第四代网络搜索引擎(NSE)架构问世 |
| Google正开发语音搜索技术 搜索模式将改变 | 微软研究院亮绝活 三大技术革新人机界面 |
| Google推出微型搜索设备 降低价格拓展市场 | 黄页搜索新技术冲击Google、百度传统势力 |
| Sun研发新技术:能按用户欣赏口味搜索歌曲 | 手机无线搜索技术兴起 演绎个性化移动生活 |
| 美政府研发超级搜索引擎 性能要超越Google | Google推出"桌面搜索1.0" 可搜... |
| 盖茨称微软计划开发能直接回答问题搜索引擎 | Google开辟视频观赏频道 续写搜索神话 |
| Accoona收编邓百氏企业数据库 提升搜索实力 | 搜索引擎是什么? |
| 近似镜像网页检测算法的研究与评价 | Hilltop: A Search Engine based on Expert Documents |
| The PageRank Citation Ranking: Bringing Order to the Web | The Anatomy of a Large-Scale Hypertextual Web Search Engine |
| The Google File System | 开源spider一览 |
| Breadth-first search crawling yields high-quality pages | WEB超链分析算法纵览 |
| 2.0时代的搜索 | 元搜索引擎系统合成算法的约束条件 |
| 张朝阳发布搜狗令 找寻10万年薪搜狗代言狗 | Robots Exclusion |
| Robots Exclusion | The Web Robots FAQ |
| Focused Crawling: A New Approach to Topic-Specific Web Re... | Automated Text Processing Related Short Bibliography |
| Transformation-Based Learning Bibliography | Parsing, indexing, and searching XML with Digester and Lu... |
| 如何找到分词词典? | 请教分词算法速度优化 |
| 现在中文分词主要用的是什么方法。给个介绍 | 编写简单的中文分词程序 |
| 中文搜索引擎技术揭密:中文分词 | 中文搜索引擎技术揭密:中文分词 |
| 测试lucene的所有分词接口 | 基于逆向最大化词表中文分词法 |
| 中文分词和二元分词综合对比 | 向Lucene增加中文分词功能 |
| 汉语的计算机理解 | Lucene中StandardTokenizer.jj解读 |
| 汉语拼音与汉语信息处理技术 | 概念搜索"是未来发展的方向 |
| Lucene倒排索引原理 | 雅虎、Groxis携手发布全球首家视觉搜索网站 |
| 百度公布“2005中国关键词” | 亚马逊创搜索服务新模式 用户自建搜索引擎 |
| 日本政府将建立网络搜索引擎研究小组 | The Lucene search engine: Powerful, flexible, and free |
| jGuru: How can I index JSP files? | jGuru: Where does the name Lucene come from? |
| Can Lucene do a "search within search", so that... | jGuru: How can I index Powerpoint documents? |
| jGuru: What happens when I open an IndexWriter , optimize... | jGuru: Is there a maximum number of segment infos whose s... |
| jGuru: Is there a way to dynamically get a document summa... | jGuru: How do I make sure that a match in a document titl... |
| jGuru: What are all possible concurrent Lucene requests? | jGuru: How do I update a document or a set of documents t... |
| jGuru: How do I retrieve all the values of a particular f... | jGuru: How can I index Word documents? |
| jGuru: How can I index XML documents? | Parsing, indexing, and searching XML with Digester and Lu... |
| jGuru: What is the purpose of write.lock file, when is it... | jGuru: How do I restrict searches to only return results ... |
| jGuru: How do I get the last document added that has a pa... | jGuru: Is there a way to limit the size of an index? |
| jGuru: Is there a way to use a proximity operator (like n... | jGuru: Are Wildcard, Prefix, and Fuzzy queries case sensi... |
| jGuru: Is the IndexWriter class, and especially the metho... | jGuru: How can I get all documents in the index? Is there... |
| jGuru: Why does IndexReader ´s maxDoc() return an &... | jGuru: Do document IDs change after merging indices or af... |
| jGuru: What is the order of fields returned by Document.f... | jGuru: How do I delete documents from the index? |
| 传Google欲收购面部图像识别小公司Riya | 搜索引擎技术及趋势 |
| 网络搜索 从“本地”开始-搜索引擎 | 天网副总裁杨明刚:天网融资顺利 2、3家搜索企业能活下去 |
| Free Search Engine, SEO, Web Design | Free Tips: Glossary of Terms |
| 平方智能搜索引擎及系列产品 | DESE外网搜索解决方案 |
| 优化搜索引擎:借助 FrontPage 2002 使排名靠前 | 2005:中国搜索丰收年 |
| 搜索引擎设计实用教程-以百度为例 | 李彦宏:搜索改变人生 |
| Web搜索引擎设计和实现分析 | a ranking tutorial |
| A Fast String Scanning Algorithm with Small Startup Overhead | Lucene倒排索引原理 |
| The Lucene search engine: Powerful, flexible, and free | Introduction to Text Indexing with Apache Jakarta Lucene |
| Advanced Text Indexing with Lucene | An Adaptive Model for Optimizing Performance of an Increm... |
| Relevant Open Source Projects, Code and Libraries | Focused Crawling: A New Approach to Topic-Specific Web Re... |
| JEP: The Deep Web | Crawling towards Eternity |
| Agents vs. Big Fat Webservers | Focused Crawling Review |
| Web Crawler Review | SRC Technical Note 1997-015, Syntactic Clustering of the Web |
| Trawling emerging cyber-communities automatically | Graph structure in the web |
| The Anatomy of a Search Engine | Efficient Crawling Through URL Ordering |
| A Methodology for Sampling the World Wide Web | WEB超链分析算法纵览 |
| Ask Jeeves发布新搜索技术 | 了解搜索引擎基本工作原理 |
| 搜索引擎三大主要类别简介 | 搜索引擎发展史回顾 |
| 如何提高网站在Google中的排名??面向搜索引擎的网站设计 | 利用Squid反相代理缓存实现网站内容静态发布 |
| The Extreme Searcher´s Guide to Web Search Engines | Web Search Engines FAQS: Questions, Answers, and Issues |
| On Caching Search Engine Query Results | 集中/分布式搜索引擎的4种设计方案:Search Engin... |
| About the Verity Spider | The Role of Style Files |
| 汉语的计算机理解 | 中文分詞技術 |
| 中文分词和二元分词综合对比 | 研究中心 - 分词 |
| 汉语分词在中文软件中的广泛应用-索引与分词-搜索引擎技术 | 中文信息处理的现状和发展方向-索引与分词-搜索引擎技术 |
| 中文分词方法-索引与分词-搜索引擎技术 | 海量详解中文智能分词 |
| 编写简单的中文分词程序 | 信息检索的核心支撑技术 |
| 主要中文网页搜索引擎介绍 | 中文搜索引擎技术揭密:排序技术 |
| 中文搜索引擎技术揭密:网络蜘蛛 | 中文搜索引擎技术揭密:系统架构 |
| 搜索引擎技术简析 - | 搜索引擎技术发展简析 |
| 中文搜索引擎技术揭密:中文分词 | 第三代搜索引擎技术与P2P |
| Breadth-First Search Crawling Yields High-Quality Pages | Block-level Link Analysis |
| Cre8: Microsoft´s new research : Block-level link a... | Page layout drives Web search |
| Google:可搜索网页数量不是一切 | Scientific American: Feature Article: Hypersearching the ... |
| Finding What People Want: Experiences with the WebCrawler | 测试lucene的所有分词接口(原创) |
| Lucene学习系列之一:Lucene中的基本概念 - | 给Lucene加入性能更好的中文分词(原创) |
| ONJava.com: Advanced Text Indexing with Lucene | 基于逆向最大化词表中文分词法_.NET- 技术文章- |
| Lucene研究之二??系统结构分析初步 | Lucene 全文检索实践(3) |
| Lucene 全文检索实践(2) | Lucene 全文检索实践(1) |
| 中文搜索引擎技术揭密:中文分词 | 中英文混和的StopWords列表! |
| Lucene中StandardTokenizer.jj解读 | 中文搜索引擎技术揭密:排序技术 |
| Nutch中Analysis包下的NutchAnalysis... | 英文StopWords列表 |
| Lucene于搜索引擎技术(Analysis包详解) | 比较基于词表和N-Gram两种切分方式! |
| 向Lucene增加中文分词功能 | 拼音转换及智能纠错技术 |
| Lucene中文分词的highlight显示 | 什么是垂直搜索引擎(之二) |
| 我对垂直搜索引擎的几点认识 | Mercator: A Scalable, Extensible Web Crawler |
| [转载]Lucene倒排索引原理 - | Manageability - Open Source Web Crawlers Written in Java |
| Writing a web crawler |