跳转到内容

维基百科讨论:使用时光机

页面内容不支持其他语言。
维基百科,自由的百科全书


Wayback Machine存档后的页面消失

[编辑]

虽然不是维基百科的工具,但是想问问有没有遇到相同情况的朋友。因条目需要,参考Wikipedia:使用时光机,使用Wayback Machine存档该页面后,提示存档成功并生成了存档链接,一开始是可以正常查看的,但一段时间后页面转而提示“The Wayback Machine has not archived that URL.”,尝试了两次都是同样的情况。该站点似乎并没有robots.txt文件,并且也存在其他页面的正常存档。由于存档链接已经添加到条目中,在这种情况下是否应该先移除存档链接呢?--立日留言2021年6月23日 (三) 10:20 (UTC)[回复]

如果您說的是這筆存檔,我剛剛到web.archive官網上去重新操作一次就成了,您可以在天主教厦门教区下方直接點擊看看,不過紀錄時間是剛剛的下午六點多,也沒看到你先前的存檔,可能有些技術問題吧。此外就算在官網存檔,我也偶爾會遇到類似你說的狀況,要過幾個小時才找的到。如下次再遇到這種情況,我會建議先放著,過至少幾小時到官網上確認有沒有存到檔,沒有就重新存一次。--迴廊彼端留言2021年6月23日 (三) 11:05 (UTC)[回复]
@迴廊彼端:谢谢,我刚刚可以打开您提供的这版本的存档,但现在似乎又再次失效了。--立日留言2021年6月23日 (三) 11:26 (UTC)[回复]
@迴廊彼端:不好意思,似乎是间歇性失效,突然存档又出现了。感觉不是很稳定的样子。--立日留言2021年6月23日 (三) 11:31 (UTC)[回复]

Wayback Machine不能存档am730的网页,大家能推荐其它存档方法吗?

[编辑]

am730似乎只能从香港访问,内中报道如[1]在用Wayback Machine存档时出错。求推荐其它存档方法。谢谢!--Benevolen留言2022年1月9日 (日) 03:30 (UTC)[回复]

去Google搜一下然后看网页快照,比如你这个。快照--在下荷花请多指教欢迎签到2022年1月9日 (日) 10:26 (UTC)[回复]
@Benevolen--在下荷花请多指教欢迎签到2022年1月9日 (日) 10:26 (UTC)[回复]
感谢指点!还改为这个功能不复存在了--Benevolen留言2022年1月9日 (日) 20:54 (UTC)[回复]
看来需要程序员开发开源的网页存档器以供我们自建。--Txkk留言2022年1月9日 (日) 13:42 (UTC)[回复]
有了!ArchiveBox --Txkk留言2022年1月10日 (一) 11:57 (UTC)[回复]

谷歌网页快照能存档多久?

[编辑]

我找到一个光明日报来源,但是光明网上的页面已经被删除了,然而谷歌网页快照还存了档,我现在在该来源的存档URL里填的网页快照网址,这个会被谷歌删除吗?如何能把谷歌快照的内容备份进web archive?--有困扰的话,就让魔女用魔法帮你排忧吧! 2022年10月26日 (三) 14:49 (UTC)[回复]

会删,不确定保留多久,可能几周到几个月吧。archive.is支持存档和索引(检索)谷歌快照,但该网站最近似乎下线了。web archive我不确定能否存档快照,经测可以。以前是不行的,因为robots.txt以前不存、会删2017年4月开始忽略。--YFdyh000留言2022年10月26日 (三) 17:30 (UTC)[回复]
“但该网站最近似乎下线了”,并没有。根据en:archive.today#Cloudflare_DNS_availability所述,用了Cloudflare的DNS服务,可能会打不开这个网站。你用了什么翻墙软件?--Txkk留言2022年10月28日 (五) 10:01 (UTC)[回复]
感谢提示,困扰已久。可能软件配置和网站问题兼有,出问题时可能在调用OpenDNS。之前访问总是看到nginx的欢迎页面,https正常,所以我以为网站故障了。--YFdyh000留言2022年11月1日 (二) 10:20 (UTC)[回复]
但是我存了以后发现webarchive好像最后存的是光明网首页,你能试试看怎么在web archive存谷歌快照吗--有困扰的话,就让魔女用魔法帮你排忧吧! 2022年10月27日 (四) 03:42 (UTC)[回复]
见我那个“可以”的链接。快照页面会因JS自动跳转到光明网,必须想办法(比如禁用JS,或者改URL参数)打开纯文字版来存档。其实不存档也非不行,应该还有图书馆能查到,不过存档了更方便查证就是。--YFdyh000留言2022年10月27日 (四) 03:45 (UTC)[回复]
哦没事了,存好了--有困扰的话,就让魔女用魔法帮你排忧吧! 2022年10月27日 (四) 03:44 (UTC)[回复]
Google 頁庫存檔一段時間後會刪的。建議妳用 https://web.archive.org/save 存檔。 -- Shyangs留言2022年10月26日 (三) 17:38 (UTC)[回复]
网址不是必须的。--Kethyga留言2022年10月27日 (四) 05:10 (UTC)[回复]

标题文本

[编辑]

存不了的網站……

昨天晚上發現知乎zhihu.com似乎保存不了……存檔結果是“您当前请求存在异常,暂时限制本次访问”

應該還有幾個國內大網站不能保存。

  • 淘寶taobao.com
  • 新浪微博weibo.com
  • 網易雲音樂music.163.com

--Zyksnowy留言2022年11月24日 (四) 04:42 (UTC)[回复]

顺路报告,近几个月,用archive.is查看或存档知乎页面,似乎无法成功,且会导致archive.is网站不再能正常访问(出现异常cookie)。不知道其他人是否能重现。--YFdyh000留言2022年11月24日 (四) 05:39 (UTC)[回复]
這四個網站都有單獨的圖片服務器,可以單獨保存……可能容易丟失網址

提议对WP:WBM达成共识,对条目内链接尽量在未失效前进行网页存档

[编辑]
下列討論已經關閉,請勿修改。如有任何意見,請在合適的討論頁提出,而非再次編輯本討論。

因为WP:WBM只是论述,不属于方针或指引,为避免出现网页失效,提议将WP:WBM达成共识,规范使用网站时光机,对网页预防性进行保护,同时有方针指引可尽量避免发生不必要的编辑战。——航站区留言2024年9月18日 (三) 15:36 (UTC)[回复]

首先,这是操作指南;其次,从你的发言中可以看出你并不理解什么是“共识”。--自由雨日🌧️留言贡献 2024年9月18日 (三) 15:42 (UTC)[回复]
我对于共识的理解来源于WP:CON,另外我说的是把WP:WBM达成共识,规范使用网站时光机,以免没任何约束性,每个编者可以根据自己的习惯或者喜好,想加就加想删就删,避免编辑战的出现--航站区留言2024年9月18日 (三) 15:55 (UTC)[回复]
请解释约束性和为何能避免编辑战。--YFdyh000留言2024年9月18日 (三) 18:28 (UTC)[回复]
没有约束 你觉得加也是对的 他觉得减也是对的 就会出现编辑战,例如Special:Diff/84256834Special:Diff/84256939Special:Diff/84257817Special:Diff/84258012Special:Diff/84258178--航站区留言2024年9月18日 (三) 18:37 (UTC)[回复]
實際上任何來源添加到維基百科時,大部份來源會被Wayback Machine在一段時間內自動存檔,況且維基還有機器人InternetArchiveBot,我的看法是不應強制用戶使用IABotManagementConsole或手動添加存檔網址,也不用特別鼓勵或建議。反而是如果有用戶在條目使用IABotManagementConsole或手動添加存檔網址,應嚴禁其他用戶復原或刪除相關編輯。--HanTsî留言2024年9月18日 (三) 18:52 (UTC)+1 [回复]
你这个观点我认同,毕竟没有规矩不成方圆--航站区留言2024年9月18日 (三) 19:02 (UTC)[回复]
支持。--糯米花留言2024年9月18日 (三) 22:38 (UTC)[回复]
(+)支持,不强制添加,但添加后不应删除。--Uyi liu2 幸泉居士✍️ 2024年9月19日 (四) 01:24 (UTC)[回复]
“應嚴禁其他用戶復原或刪除相關編輯”,IABot出过好几次故障了,更何况嚴禁的话,是否有考虑任何不应严禁的特殊情况?--百無一用是書生 () 2024年9月19日 (四) 02:07 (UTC)[回复]
能够形成一个共识即可,以免公说公有理婆说婆有理--航站区留言2024年9月19日 (四) 02:21 (UTC)[回复]
故障的編輯直接視同為破壞處理就行了。--HanTsî留言2024年9月19日 (四) 04:34 (UTC)[回复]
這裡我想邀請另一方當事者@Txkk君,請至此處討論,謝謝。--薏仁將🍀 2024年9月19日 (四) 02:44 (UTC)[回复]
谢邀。各位(除了航站区)把我的意思都表达出来了,我就没什么可补充了的。--Txkk留言2024年9月20日 (五) 01:38 (UTC)[回复]
任何來源添加到維基百科時,大部份來源會被Wayback Machine在一段時間內自動存檔,機器人InternetArchiveBot添加存檔網址,可视情况进行删改。
不應強制用戶使用IABotManagementConsole或手動添加存檔網址。但如果有用戶在條目使用IABotManagementConsole或手動添加存檔網址,原则上嚴禁其他用戶復原或刪除相關編輯。

大家可以讨论一下,结合了我、User:ShizhaoUser:HanTsî的观点——航站区留言2024年9月19日 (四) 02:52 (UTC)[回复]

我认为相关说明应该放在Wikipedia:列明来源(或者Wikipedia:外部链接)上(并且对应Wikipedia:失效链接),而不是将一本说明书打上格式指引的标签。虽然明白提议者的想法。——Sakamotosan路过围观 | 避免做作,免敬 2024年9月19日 (四) 04:07 (UTC)[回复]
PS.其实Wikipedia:失效链接里面就说过,除了使用网页存档服务外,可以在引用模板摘录出引述条目语句的原文,这样也可以起到参考内容“存档”的作用。——Sakamotosan路过围观 | 避免做作,免敬 2024年9月19日 (四) 04:14 (UTC)[回复]
因为现阶段讨论的是,在有效期内提前存档问题,阁下提及的是失效补救问题,好像方向不一样啊--航站区留言2024年9月19日 (四) 04:12 (UTC)[回复]
道理一样,就是“插入外部链接来源作为参考资料时,应该建议同时做一次页面存档(然后手工加上存档页或者IABot添加)”,Wikipedia:失效链接看上去亡羊补牢,但同时也是防患未然。——Sakamotosan路过围观 | 避免做作,免敬 2024年9月19日 (四) 04:18 (UTC)[回复]
@Cwek那阁下觉得,其实是不是可以把这个提议和上面一个提议合并?--航站区留言2024年9月19日 (四) 04:19 (UTC)[回复]
嗯,其实大致就是上面的议题,添加上本操作手册来配合操作。——Sakamotosan路过围观 | 避免做作,免敬 2024年9月19日 (四) 04:24 (UTC)[回复]
不知道上面的提议者是否愿意合并?--航站区留言2024年9月19日 (四) 04:28 (UTC)[回复]
“大致就是上面的议题(提議對維基百科:列明來源的網頁部分新增關於存檔的要點),添加上本操作手册来配合操作”,我认为说得足够清晰了。——Sakamotosan路过围观 | 避免做作,免敬 2024年9月19日 (四) 04:45 (UTC)[回复]

( π )题外话:页面中的存档链接也有保护隐私的效用。部分用户在同时可以选择的情况下仍然会优先访问存档链接。——暁月凛奈 (留言) 2024年9月19日 (四) 04:51 (UTC)[回复]

这个有待商榷,比如机器人五年前的网页存档,但是这个网址到现在还能访问,并且该网页界面和五年前已经有很大变化了,这个时候访问网页存档就没有什么意义了。我希望机器人能不能每隔一段时间把网页存档的未过期的网页进行存档更新,这样不至于网页存档和网站随着时间的流逝,差别越来越大--航站区留言2024年9月19日 (四) 04:59 (UTC)[回复]
不認可。網站的內容可能會發生變化,以編者加入維基百科時的內容(當時的存檔)為準最為穩妥。--糯米花留言2024年9月19日 (四) 05:27 (UTC)[回复]
那如果「外部链接」呢?比如一些作品的官网,比如五年前加入的网页存档和现在界面出现了很大差异,我觉得「外部链接」放置作品官网地方应该以截止他失效前最新状态为主--航站区留言2024年9月19日 (四) 08:27 (UTC)[回复]
我觉得外部链接通常不该加存档链接,只是机器人经常加。--YFdyh000留言2024年9月19日 (四) 10:33 (UTC)[回复]
IABot的管理界面支持URL的存档状态更新的。但看情况是否需要更新存档页面的数据,不强制为规范性条文。——Sakamotosan路过围观 | 避免做作,免敬 2024年9月19日 (四) 05:46 (UTC)[回复]
机器人有个不智能的地方就是,一个条目存档过了的链接,下次就不会再重新存档了,我希望能设计成每隔一段时间机器人自动探测,把网页存档的未过期的网页进行存档更新,这样不至于网页存档和网站随着时间的流逝,差别越来越大--航站区留言2024年9月19日 (四) 08:30 (UTC)[回复]
这应该是IAbot的问题,请跟IAbot的维护者反馈。——Sakamotosan路过围观 | 避免做作,免敬 2024年9月19日 (四) 11:30 (UTC)[回复]
就事論事,鼓勵網頁存檔本就沒啥問題,也是落實本站可供查證的基本原則,我看不出來有什麼爭議可言?—— Eric Liu 創造は生命(留言留名學生會 2024年9月19日 (四) 06:23 (UTC)+1 [回复]

本討論已關閉,請勿修改。如有任何意見,請在合適的討論頁提出,而非再次編輯本討論。

提醒:互联网档案馆暫時無法使用

[编辑]
已通過
已有其他較詳細討論,故關閉此議題。—— Eric Liu 創造は生命(留言留名學生會 2024年10月26日 (六) 21:51 (UTC)[回复]
下列討論已經關閉,請勿修改。如有任何意見,請在合適的討論頁提出,而非再次編輯本討論。

archive.org目前顯示「Temporarily Offline」,從昨天的新聞[3]來看可能是遭駭客攻擊。--EzrealChen留言2024年10月11日 (五) 08:54 (UTC)[回复]

最近数日也显示当机无法进行新存档。不过对于一个喜欢快速删除十余年以前的文章、塑造民众记忆的审查机制来说,WebArchive就是他们最大的敌人吧。--Allervousシカ部・ざ・ろっく! 2024年10月19日 (六) 00:13 (UTC)[回复]
(~)補充:可以跟下面那一段讨论Wikipedia:互助客栈/其他#Internet_Archive已暫停多日合并。--Allervousシカ部・ざ・ろっく! 2024年10月19日 (六) 00:14 (UTC)[回复]

本討論已關閉,請勿修改。如有任何意見,請在合適的討論頁提出,而非再次編輯本討論。

Internet Archive已暫停多日

[编辑]

Internet Archive已暫停多日,有點擔心線上來源的備份。大家有沒有聽說什麼消息?--Factrecordor留言2024年10月13日 (日) 05:10 (UTC)[回复]

見上面#提醒:互联网档案馆暫時無法使用。簡言而之,被DDoS了,沒攻成後用其他攻擊手段掘到了用戶數據,之後漏了出去[4]。這情形一般都是要關掉外部連接以免進一步受攻擊,之後再在內部修復漏洞,修完後才會放出來。至於被攻擊的原因呢,承認是次攻擊責任的組織表示是出於以巴戰爭當中美國政府的立場[5]--S叔 2024年10月13日 (日) 05:52 (UTC)[回复]
見到時光機剛剛再次上線[6]。--Uranus1781留言2024年10月14日 (一) 08:11 (UTC)[回复]
他们的推特有在更新进展:https://twitter.com/internetarchive/ ,目前为只读状态,无法添加新存档。--Tim Wu留言2024年10月14日 (一) 08:13 (UTC)[回复]
养成了同时在archive.today和Internet Archive存档的习惯……希望IA能挺过去。--Tim Wu留言2024年10月14日 (一) 08:18 (UTC)[回复]
其實需要小工具支援更多存檔網站(甚至同時存檔功能)為是。—— Eric Liu 創造は生命(留言留名學生會 2024年10月14日 (一) 09:02 (UTC)[回复]
不知道何时能够恢复--航站区留言2024年10月29日 (二) 13:07 (UTC)[回复]

现在是只能浏览,不能使用Save Page Now(新增页面存档)。archive.is(作为备胎)也是不错的,和Internet Archive最大的区别就是页面爬完后会把javascript给冻结掉,这个有时是优点(例如部分新闻网页的付费墙用is能绕过但ia无法绕过)有时也是缺点(例如无法展开折叠内容)。--💊✖️2️⃣3️⃣留言2024年10月16日 (三) 10:30 (UTC)[回复]

其他還有Webarchive.io,不過Internet Archive用最多資料也較齊全,這樣下去也不是辦法。 --窝法乙烷 儿法梦碎 2024年10月16日 (三) 13:33 (UTC)[回复]
话说是否有服务器设于中国大陆的存档服务?--Tim Wu留言2024年10月16日 (三) 14:11 (UTC)[回复]
百度快照? --窝法乙烷 儿法梦碎 2024年10月16日 (三) 14:21 (UTC)[回复]
不是早没了?——Sakamotosan路过围观 | 避免做作,免敬 2024年10月17日 (四) 10:55 (UTC)[回复]
百度百科自己有参考资料预览(就是点进参考资料链接不会直接进入原始内容,会先打开存档),但是还得编辑百度百科,所以等于没有。 ——魔琴身份声明 留言 贡献 新手2023 2024年10月18日 (五) 05:40 (UTC)[回复]
今年Google在取消缓存服务后,改为与IA合作(不知道这样搞IA是不是多了个大金主不愁没人捐钱了),结果没过多久就发生ddos的事情……--💊✖️2️⃣3️⃣留言2024年10月16日 (三) 16:05 (UTC)[回复]
这么多天过去了,添加网页存档(Save Page Now)的功能还是不能用……这ddos攻势一打威力有这么大……--💊✖️2️⃣3️⃣留言2024年10月28日 (一) 10:46 (UTC)[回复]
[7]之前已說了,攻撃的手段除DDoS外還有其他。共有三波攻撃,由不同人士策動。主要都針對API tokens。"In the Internet Archive breach, hackers stole access tokens, allowing them to bypass security measures and gain entry into sensitive platforms, such as Zendesk. This allowed them to access user data, including support tickets without needing a password."--S叔 2024年10月30日 (三) 13:38 (UTC)[回复]
更:目前IABot的頁面已停用(希望這代表技術團隊正努力讓它復原🫠)--樹葉上的o(* ̄▽ ̄*)ブ木漏れ日 2024年11月3日 (日) 02:29 (UTC)[回复]
我剛剛發現網際網路檔案館的自動存檔功能似乎已經恢復了,官方擴充功能也得以重新運作。—— Eric Liu 創造は生命(留言留名學生會 2024年11月4日 (一) 12:21 (UTC)[回复]
手动保存也恢复了,真是太好了。--Tim Wu留言2024年11月4日 (一) 12:26 (UTC)[回复]
https://iabot.wmcloud.org/index.php
但這個好像還沒好的樣子?--樹葉上的o(* ̄▽ ̄*)ブ木漏れ日 2024年11月4日 (一) 13:06 (UTC)[回复]
二更:IABot已可正常運作--樹葉上的o(* ̄▽ ̄*)ブ木漏れ日 2024年11月6日 (三) 05:00 (UTC)[回复]