搜索日志分析(search log analysis),管理学-情报学-信息组织-信息构建-【信息构建流程和方法】,通过记录和分析用户的行为特征,认识用户意图和兴趣来改善搜索引擎的性能,为用户提供个性化信息服务的方法。搜索日志是搜索者在搜索过程中留下的客观痕迹,记录用户与搜索引擎交互的主要行为信息,是分析研究真实的网络用户行为的主要途径和载体。这些文件包含大量的用户访问信息,如用户的互联网协议地址所访问的统一资源定位符、访问日期和时间、访问路径等。搜索日志挖掘是将现有的数据挖掘技术应用于网络应用程序的日志分析过程中,旨在挖掘用户的行为特点、使用规律、兴趣偏好等,并用来改进网络应用的性能。搜索日志分析是从网络的存取模式中获取有价值信息的过程,通常是对用户访问因特网时在服务器留下的访问记录进行分析,寻找其中蕴含的规律。用户在访问因特网时可产生三种网络日志:服务器端日志、浏览器端日志、代理服务器端日志。①服务器端日志。文件获得的信息可能会由于本地缓存技术而出现失真;而且有许多重要数据,诸如用户的各种浏览行为、页面驻留时间等并不能从服务器端日志中获取,因此对客户端日志文件的挖掘显得尤为重要。