找回密码
 注册

QQ登录

只需一步,快速开始

搜索
查看: 3417|回复: 0

wikipedia 镜像办法

[复制链接]
DAHE 发表于 2008-5-23 21:32:24 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册

×
这里是 wikipedia 的 sql dump 数据文件

http://download.wikipedia.org/zhwiki/

打开最新的日期的目录。里面这个 “Articles, templates, image descriptions, and primary meta-pages.” 就是一般镜需要的数据,包括文章、图片描述和 meta 页面。

http://download.wikimedia.org/zh ... es-articles.xml.bz2

注意:这个包含 wikipedia 的 meta 信息,比较烦,会定制很多 Mediawiki: 名字空间的页面。可能我们需要的仅仅是 articles,你也许可以尝试一下后面更小的压缩包。比如那个 for yahoo 的 Extract 包。也许那里没有 meta 只有文章。我没有测试过。

下载后解压,大约700-800M,上传到 wiki 的 maintenance目录,然后在命令行执行 php

php importDump.php < 1234.xml

你会看到一行一行的提示信息,导入中...

如果你没有php命令行的话,ubuntu 安装 php 命令行:

sudo apt-get install php5-cli
论坛发展靠大家,积极提供资源;请勿灌水
通过分享您的互联网来赚钱
您需要登录后才可以回帖 登录 | 注册

本版积分规则

QQ|手机版|小黑屋|存档|商匡数科 ( 沪ICP备19008575号-1 )

GMT+8, 2024-10-4 12:03 , Processed in 0.030574 second(s), 20 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表