李子与什么食物相克| 32周孕检检查什么项目| 相伴是什么意思| 梦见悬崖峭壁是什么意思| 肠子长息肉有什么症状| 下身有点刺痛什么原因| 子宫病变有什么症状| 煎牛排用什么油| 泄露是什么意思| 黄色分泌物是什么原因| 花中隐士是什么花| 安享晚年是什么意思| 中水是什么| 替班是什么意思| 扁桃体发炎是什么原因引起的| 空气湿度是什么意思| 护士资格证有什么用| 五毛是什么意思| 甲状腺在什么位置图片| 不打紧是什么意思| 中元节是什么节日| 邹去掉耳朵旁读什么| 定点医院什么意思| 广义货币m2是什么意思| 太阳鱼是什么鱼| 站着说话不腰疼是什么意思| 不宁腿综合症是什么原因引起的| 8月20号什么星座| 晚霞是什么意思| 为什么同房过后会出血| 两三分钟就射什么原因| 淘宝什么时候有活动| 当归有什么作用| 瓷娃娃什么意思| 浮躁是什么意思| 蔓越莓对女性妇科有什么好处| 什么花是白色的| 小龙虾什么季节| 猫砂是什么材料做的| 才高八斗是指什么生肖| 眼皮红肿是什么原因| 气胸病是什么原因引起的| 空调出现pl是什么意思| 鳞状上皮化生什么意思| 永垂不朽的垂是什么意思| 一库一库雅蠛蝶是什么意思| 经常吐是什么原因| 嗓子痛挂什么科| 七什么八什么| 发泥和发蜡有什么区别| 退步是什么意思| 脾切除后有什么影响和后遗症| 人体最大的细胞是什么| 专技十三级是什么意思| 昔日是什么意思| 印第安人是什么人种| 做梦掉牙齿是什么预兆| 摩拳擦掌是什么意思| 怀疑心衰做什么检查| 心肌酶是检查什么的| 二月十七是什么星座| 怀孕后为什么会生化| 2028什么年| 中国的国菜是什么| 衣食无忧是什么生肖| 送什么生日礼物给妈妈| 左耳朵嗡嗡响是什么原因引起的| lagogo是什么牌子| 直升是什么意思| 肺气阴两虚吃什么中成药| 火耗归公是什么意思| 活在当下是什么意思| 满月针最晚什么时候打| 处暑的含义是什么意思| 骁字五行属什么| 女生取什么名字好听| 警备区是干什么的| 草木皆兵是什么意思| 肚子一按就痛什么原因| 减肥可以吃什么肉| 摩羯座什么时候| 草头是什么菜| 午时五行属什么| 头晕为什么做眼震检查| 梦见蛇是什么预兆| 黄腔是什么意思| 胃复安又叫什么| 牙齿出血是什么病| 什么情况要割包皮| 臻字五行属什么的| 10月26是什么星座| 小腿前侧肌肉叫什么| 犀利哥什么意思| 黎字五行属什么| 诺诺是什么意思| 规培结束后是什么医生| 尖锐湿疣挂什么科| 梦见大蜘蛛是什么预兆| 繁衍的衍是什么意思| 短裙配什么上衣好看| 87年属于什么生肖| 32属什么生肖| 肾阴虚什么症状| 莫代尔是什么面料| 右半边头痛是什么原因| 来大姨妈血块多是什么原因| 五行缺土是什么意思| 什么是佛| 2024什么年| 口语化是什么意思| 鸡的祖先是什么动物| 益生菌什么时间段吃效果好| 什么不息| 女人一般什么时候容易怀孕| 鞋油自然色是什么颜色| 趋利避害是什么意思| 为什么流鼻血| 吃什么能养肝护肝| 吃什么水果减肥最快减肚子| 龙的九个儿子都叫什么名字| 狗怕什么| 七月出生的是什么星座| 翡翠是什么意思| 山梨酸钾是什么| 肠炎能吃什么食物| 蜂王浆什么时间吃最好| 什么时候种玉米| 障碍性贫血是什么病| nak是什么牌子| 什么叫市级以上医院| 浑身疼痛什么原因| 5.20是什么星座| 327是什么星座| 尿道口有灼热感是什么原因| 右眼跳什么意思| 蜱虫咬了什么症状| lycra是什么面料| 吃饭不规律会导致什么问题| 路程等于什么| 阿司匹林肠溶片什么时候吃最好| 胃有灼热感是什么原因| 坐骨神经痛吃什么药好得快| 吃什么长头发| 表面活性剂是什么| 看望老人买什么礼物好| sk是什么| 从未是什么意思| 脑子瓦特了什么意思| 1215是什么星座| 化险为夷的夷什么意思| 咳嗽什么原因引起的| 自性是什么意思| 斋醮什么意思| 阴囊炎用什么药治疗| 肠镜什么情况下取活检| 贴切的意思是什么| 另起炉灶是什么意思| 马蜂窝能治什么病| 附身是什么意思| 18岁属什么的生肖| 黄连膏有什么功效和作用| 什么是牙结石| 烤瓷牙和全瓷牙有什么区别| ng是什么单位| 胆固醇高不能吃什么食物| 每晚都做梦是什么原因| 冬枣不能和什么一起吃| 心肌缺血吃什么食物| mchc偏低是什么意思| 检测hpv挂什么科| 1288是什么意思| 得意忘形是什么意思| 艾迪生病是什么病| 怎么知道自己五行属什么| 挛缩是什么意思| 腰间盘突出有什么症状| 易主是什么意思| 肝功高是什么原因引起的| 晚上喝红酒配什么小吃| hpv感染什么症状| 门静脉高压是什么意思| 狮子座女和什么星座最配| 害怕的近义词是什么| 为什么飞机撞鸟会坠机| 垂询是什么意思| 鳖是什么动物| 经常头疼是什么原因引起的| 风湿性关节炎用什么药| 望洋兴叹什么意思| 静脉曲张是什么意思| 头皮痒掉发严重是什么原因| 青稞面是什么| 消渴症是什么病| 血小板低什么原因| 长口腔溃疡是什么原因| 溥仪为什么没有后代| 什么器官分泌胰岛素| 稀奶油是什么奶油| 屁股上有痣代表什么| 胃肠镜能检查出什么病| 下过海是什么意思| 什么是猥亵| 什么是干细胞| 外贸原单是什么意思| 20年是什么年| 改良剂是什么| 今天是什么生肖日| 吸烟有害健康为什么国家还生产烟| 白羊座是什么性格| 王八羔子是什么意思| 无私的动物是什么生肖| 长时间手淫有什么危害| 大型血小板比率偏低是什么意思| 咳嗽痰多用什么药| 舌头白苔厚是什么原因| 不吃香菜什么意思| 查颈椎挂什么科| 疏离感是什么意思| 智商105是什么水平| 一个虫一个圣念什么| 什么叫臆想症| 猫来家门口有什么预兆| 什么鱼炖豆腐好吃| 牛黄是什么| 李子什么季节成熟| 什么叫消融术治疗| 蚕豆病是什么| 喝茶失眠是什么原因| 不出汗的人是什么原因| 耐药是什么意思| 鄂尔多斯是什么意思| 冬枣是什么季节的水果| 炖牛肉放什么| 丹毒是什么原因引起的| 春饼卷什么菜好吃| 见干见湿是什么意思| 脚心烧是什么原因| 包皮发炎红肿用什么药| 早搏是什么原因引起的| 两个立念什么| 乳腺结节不能吃什么| 养牛仔裤是什么意思| 什么食物是碱性的| 吉祥是什么生肖| 碧潭飘雪是什么茶| 二级乙等医院什么档次| f代表什么| 程门立雪是什么生肖| 姨妈推迟是什么原因| ck是什么牌子的包包| 茹毛饮血什么意思| 黄色配什么颜色好看| 高密度脂蛋白胆固醇偏高什么意思| 儿童身高矮小挂什么科| 24D是什么激素| 指甲长出来是白色的什么原因| 兵马未动粮草先行是什么意思| 珍珠母贝是什么东西| 女孩缺金取什么名字好| 马脸是什么脸型| 凌波仙子指的是什么花| 女性得疱疹是什么症状| 尿酸是什么意思| 四肢冰凉是什么原因| 百度Zum Inhalt springen

时光如梭是什么意思

aus Wikipedia, der freien Enzyklop?die
百度 同样是长沙第一代城市综合体的悦方IDMall在近两年也是动作频频。

Web-Archivierung bezeichnet das Sammeln und dauerhafte Ablegen von Netzpublikationen mit dem Zweck, in der Zukunft ?ffentlichkeit und Wissenschaft einen Blick in die Vergangenheit bieten zu k?nnen. Ergebnis des Vorgangs ist ein Web-Archiv.

Die gr??te internationale Einrichtung zur Web-Archivierung ist das Internet Archive in San Francisco (USA), das sich als Archiv des gesamten World Wide Web versteht. Staatliche Archive und Bibliotheken in vielen L?ndern unternehmen Anstrengungen zur Sicherung der Netzüberlieferung in ihrem Bereich.

Die deutschen Archivgesetze definierten ab 1987 die Archivierung digitaler Unterlagen als Pflichtaufgabe der staatlichen Archive, die Umsetzung dieses Auftrags l?uft aber erst an. Im Jahr 2006 wurde das DNBG (Gesetz zur deutschen Nationalbibliothek) verabschiedet, das den Auftrag der Deutschen Nationalbibliothek auf die Archivierung von Websites ausdehnt. Auch die Bundesl?nder planen, ihre Pflichtexemplar-Gesetze in diesem Sinne zu ?ndern, oder haben die ?nderung bereits vollzogen.

Archivierungsziele

[Bearbeiten | Quelltext bearbeiten]

Web-Archivierung verfolgt das Ziel, einen definierten Ausschnitt der im Internet vorhandenen Web-Pr?senzen in systematischer Form abzubilden. Hierfür sind eine übergreifende Sammlungspolitik, ein Auswahlverfahren und die H?ufigkeit der Archivierung vorab zu kl?ren.

Eine archivierte Website sollte mit allen multimedialen Funktionen (HTML-Code, Stylesheets, JavaScript, Bilder und Video) auf Dauer erhalten werden. Der sp?teren Beschreibung, Nutzung und Erhaltung dienen Metadaten wie Provenienz, übernahmezeitpunkt, MIME-Type und Umfang der Daten. Die Metadaten sichern Authentizit?t und Integrit?t der digitalen Archivalien.

Nach der übernahme sind technische und juristische Vorkehrungen zu treffen, um eine st?ndige ?ffentliche Zug?nglichkeit zu garantieren und eine nachtr?gliche Ver?nderung der Archivalien zu verhindern.[1]

Begrifflichkeiten

[Bearbeiten | Quelltext bearbeiten]
Original Resource
Eine originale Quelle, die aktuell im Internet vorhanden ist oder vorhanden sein sollte und für die ein Zugriff auf einen früheren Zustand ben?tigt wird.[2][3]
Memento
Ein Memento einer originalen Quelle ist eine Ressource, die den originalen Zustand einer Quelle zu einem definierten Zeitpunkt kapselt.[2][3]
TimeGate
Ein TimeGate ist eine Ressource, die auf Basis eines vorgegebenen Datums und einer Zeitangabe jenes Memento findet, welches dieser zeitlichen Vorgabe am besten entspricht.[2][3]
TimeMap
Eine TimeMap ist eine Ressource, welche eine Liste aller Mementos ausgibt, die für die originale Quelle je angelegt wurden.[2][3]

Auswahlverfahren

[Bearbeiten | Quelltext bearbeiten]
Unspezifisch
Bei diesem Auswahlverfahren wird eine ganze Domain nach und nach in ein Archiv geschrieben. Das Verfahren funktioniert wegen des gro?en Speicherbedarfs nur bei kleineren Domains (netarkivet.dk).
Auswahlliste
Eine Liste von Institutionen wird vorab festgelegt. Die Stabilit?t der mit den Institutionen verbundenen URLs ist regelm??ig zu prüfen.
Nutzung von Zugriffsstatistiken
In Zukunft ist ein ?intelligentes“ Harvesting (deutsch ?Ernten“) denkbar, das aufgrund von Zugriffsz?hlungen diejenigen Teile des Web (oder einer Auswahl) archiviert, die besonders hohe Zugriffsraten aufweisen.

übernahmemethoden

[Bearbeiten | Quelltext bearbeiten]

Remote harvesting

[Bearbeiten | Quelltext bearbeiten]

Die üblichste Archivierungsmethode ist die Nutzung eines Webcrawlers. Ein Web-Crawler ruft die Inhalte einer Website wie ein menschlicher Nutzer ab und schreibt die Ergebnisse in ein Archivobjekt. Genauer betrachtet bedeutet das ein rekursives Durchsuchen von Webseiten anhand der darauf gefundenen Links, ausgehend von einem gewissen Startbereich, der entweder eine Webseite oder auch eine Liste an Webseiten, die durchsucht werden sollen, sein kann. Aufgrund mengenm??iger Limitationen, etwa wegen Dauer oder Speicherplatz, sind diverse Einschr?nkungen (Abbruchbedingungen) hinsichtlich Tiefe, Domain und der zu archivierenden Dateiarten m?glich.

Bei gr??eren Projekten kommt hierbei der Bewertung von Webseiten zur URL-Reihung eine besondere Bedeutung zu. Im Verlauf eines Crawl-Vorganges k?nnen sich unter Umst?nden sehr viele Webadressen ansammeln, die dann entweder in einer Liste nach dem FIFO-Verfahren oder als Priorit?tswarteschlange abgearbeitet werden. Für letzteren Fall kann man sich die Webseiten dabei in einer Heap-Struktur vorstellen. Jede Webseite an sich bildet einen eigenen Heap und jeder darin gefundene Link zu einer weiteren Webseite bildet wiederum einen Unterheap, der ein Element im Heap der vorhergehenden Webseite darstellt. Das hat auch den Vorteil, dass im Fall einer überlaufenden URL-Liste zuerst diejenigen mit der niedrigsten Priorit?t durch neue Eintr?ge ersetzt werden.

Die Ausgangsstruktur auf dem Server l?sst sich allerdings im Archiv nur selten exakt nachbauen. Um bereits im Vorfeld einer Spiegelung eventuell auftretende technische Probleme ausschlie?en zu k?nnen, bietet es sich an, vorab eine Analyse der Webseite durchzuführen. Dies verdoppelt zwar in den meisten F?llen den Datenverkehr, verkürzt aber die aufzuwendende Arbeitszeit im Fehlerfall erheblich.[4]

Beispiele für Webcrawler sind:

Archivierung des Hidden Web

[Bearbeiten | Quelltext bearbeiten]

Das Hidden Web oder Deep Web bezieht sich auf Datenbanken, die oft die eigentlichen Inhalte einer Website repr?sentieren und nur auf Anfrage eines Nutzers ausgegeben werden. Auch dadurch ?ndert sich das Web st?ndig und es erscheint, als würde dieses eine unendliche Gr??e besitzen. Zur übernahme dieser Datenbanken ist eine Schnittstelle erforderlich, die meist auf XML beruht. Für einen solchen Zugang sind die Tools DeepArc (Bibliothèque nationale de France) und Xinq (National Library of Australia) entwickelt worden.

Transactional archiving

[Bearbeiten | Quelltext bearbeiten]

Dieses Verfahren dient der Archivierung der Ergebnisse eines Nutzungsprozesses von Websites. Es ist für Einrichtungen von Bedeutung, die aus rechtlichen Gründen einen Nachweis über ihre Nutzung zu führen haben. Voraussetzung ist die Installation eines Zusatzprogramms auf dem Webserver.

Webarchivierung in Deutschland

[Bearbeiten | Quelltext bearbeiten]

Auf Bundesebene hat die Deutsche Nationalbibliothek (DNB) seit 2006 den gesetzlichen Auftrag zur Webarchivierung. Seit 2012 werden Webseiten thematisch und bei bestimmten Ereignissen archiviert, also selektiv und nicht vollumf?nglich. Die DNB arbeitet dabei mit einem externen Dienstleister zusammen. Au?erdem wurden 2014 bisher einmalig alle DE-Domains gecrawlt. Der Zugriff auf das Webarchiv erfolgt haupts?chlich in den Leses?len.[5]

Neben der Webarchivierung der DNB gibt es in verschiedenen Bundesl?ndern Initiativen:

Au?erdem gibt es in Deutschland weitere Webarchivierungsinitiativen beispielsweise von parteinahen Stiftungen, vom SWR, von der Deutschen Post oder vom Biotechnologie-/Pharmaunternehmen Abbvie.

Einzelnachweise

[Bearbeiten | Quelltext bearbeiten]
  1. Steffen Fritz: Rewriting History. (PDF) with WARC files. Januar 2016, archiviert vom Original (nicht mehr online verfügbar) am 9. November 2017; abgerufen am 9. November 2017 (englisch).
  2. a b c d RFC: 7089 – HTTP Framework for Time-Based Access to Resource States – Memento. (englisch).
  3. a b c d Memento Guide: Introduction. Abgerufen am 5. Oktober 2018 (englisch).
  4. Steffen Fritz: Praxisreport: Verfahren zur Evaluierung der Archivierbarkeit von Webobjekten. In: ABI Technik. Nr. 2, 2015, S. 117–120. doi:10.1515/abitech-2015-0015
  5. Tobias Steinke: Das deutsche Internet archivieren? Zwischen selektivem Ansatz und .de-Domain-Crawl. Deutsche Nationalbibliothek, 26. Juni 2014 (dnb.de [PDF]).
  6. Felix Geisler, Wiebke Dannehl, Christian Keitel, Stefan Wolf: Zum Stand der Webarchivierung in Baden-Württemberg. In: Bibliotheksdienst. Band 51, Nr. 6, 1. Juni 2017, ISSN 2194-9646, S. 481–489, doi:10.1515/bd-2017-0051 (degruyter.com [abgerufen am 24. M?rz 2020]).
  7. Tobias Beinert: Webarchivierung an der Bayerischen Staatsbibliothek. In: Bibliotheksdienst. Band 51, Nr. 6, 1. Juni 2017, ISSN 2194-9646, S. 490–499, doi:10.1515/bd-2017-0052 (degruyter.com [abgerufen am 24. M?rz 2020]).
  8. Workflow Web-Archivierung in der Langzeitarchivierung an der Bayerischen Staatsbibliothek | BABS. Abgerufen am 24. M?rz 2020.
  9. Webarchivierung. Zentral- und Landesbibliothek Berlin, abgerufen am 6. Juni 2025.
  10. Webarchivierung. Landesbibliotheken NRW, abgerufen am 6. Juni 2025.
  11. Edoweb: Rheinland-pf?lzischer Archivserver für elektronische Dokumente und Websites. Abgerufen am 24. M?rz 2020.
  12. Archivierung von Websites. S?chsische Landesbibliothek — Staats- und Universit?tsbibliothek Dresden (SLUB), abgerufen am 6. Juni 2025.
人的肝脏在什么位置 分泌物豆腐渣状是什么原因 bw是什么意思 t什么意思 gbm是什么意思
什么叫意象 妈富隆是什么药 六合是什么意思 什么是宫颈纳囊 六盘水为什么叫凉都
三重一大是什么内容 小跟班是什么意思 苏联是什么国家 zd是什么意思 十一月份什么星座
吃了布洛芬不能吃什么 赤茯苓又叫什么 无花果什么时候成熟 姿态万千的意思是什么 右附件区囊肿是什么意思
hla医学上是什么意思hcv9jop5ns0r.cn 红眼鱼是什么鱼hcv9jop6ns5r.cn 藿香正气水什么味道hcv8jop4ns3r.cn 眉头下方有痣代表什么hcv8jop3ns7r.cn 膀胱癌早期是什么症状hcv7jop6ns4r.cn
榜眼是什么意思hcv8jop6ns6r.cn 蟾宫是什么意思hcv9jop7ns5r.cn 淋巴结肿大吃什么药hcv8jop8ns9r.cn 林黛玉和贾宝玉是什么关系hcv8jop3ns5r.cn kodak是什么牌子hcv9jop6ns0r.cn
什么运动瘦脸inbungee.com 早上八点到九点属于什么时辰hcv9jop6ns4r.cn 格格不入是什么意思hcv8jop1ns8r.cn 月经提前10天是什么原因hcv8jop9ns3r.cn 芥末为什么会冲鼻helloaicloud.com
弄虚作假是什么生肖hcv8jop6ns3r.cn 大是大非是什么意思yanzhenzixun.com 3月9号是什么星座gysmod.com 上海最高的楼叫什么hcv8jop2ns3r.cn 什么对眼睛好hcv8jop1ns4r.cn
百度