Humanistyka Cyfrowa

Naukowy Portal Archiwalny ArchNet prowadzi współpracę z Instytutem Józefa Piłsudskiego, na którego stronie publikowany jest Blog archiwistów i bibliotekarzy. Nowa pozycja portalu zatytułowana: „Humanistyka cyfrowa”, będzie starała się przedstawić takie aspekty rewolucji cyfrowej, które mają znaczenie dla archiwów, bibliotek, dla osób i instytucji, których zadaniem jest wprowadzanie technologii w środowisku humanistów. Nasi użytkownicy dowiedzą się między innymi dlaczego tak ważne są metadane i co jest na odwrotnej stronie zdjęcia cyfrowego, co mają do siebie Iza, Sezam i Atom i jak radzić sobie z niesfornym komputerem przy pomocy herbaty. Nowy dział dostarczy także innych informacji i nowinek przydatnych w rozszerzaniu horyzontów wiedzy.

Blog za oceanem, jak i nowy dział  Archnetu prowadzi dr Marek Zieliński, wiceprezes Instytutu Józefa Piłsudskiego w Ameryce. Autor jest prezesem i właścicielem firmy Zevax inc. oferującej usługi komputerowe, konsulting w zakresie oprogramowania, baz danych i integracji systemów komputerowych.  Autor od 1981 r. związany jest z nowojorskim prestiżowym instytutem polonijnym, od 2002 r. jest jego wiceprezesem. Mieszka i pracuje w Nowym Jorku.

Cyfrowe albumy fotograficzne które przetrwają pokolenie lub więcej. Część 1

A photo from Władysława’s album with her father among members of the organization “Sokół”, in Silna, Poland, early 1920s.

Zdjęcie z albumu Władysławy z jej ojcem wśród członków Towarzystwa Gimnastycznego “Sokół” w Silnej (Poznańskie) we wczesnych latach 1920-tych.

Wprowadzenie

Ciotka mojej żony, Władysława, zawsze trzymała rodzinne albumy gotowe do podróży. W czasie II wojny światowej, kiedy rodzina została wydalona z mieszkania w Łodzi i podczas dalszej przymusowej migracji, albumy zawsze podróżowały razem z nią w plecaku. W ten sposób albumy przetrwały i możemy teraz cieszyć się rodzinnymi zdjęciami do kilku pokoleń wstecz. Trwałość czarno-białej fotografii i dobrej jakości, bezkwasowy papier, na którym zostały wydrukowane, pomogły zachować stuletnie odbitki.

Kolorowe zdjęcia sprzed 20 lub 30 lat nie były takie trwałe. Barwniki organiczne szybko zanikają, niektóre zdjęcia tracą większość kolorów. Pracujemy nad ich digitalizacją, próbując cyfrowo przywrócić kolory, zamieniając je na cyfrowe.

Oczywiście tworzenie kopii cyfrowych starych albumów ma również inny cel, oprócz zachowania. Rodzina jest rozproszona po całym świecie. Bracia i siostry, którzy mieszkali lub pracowali w różnych regionach rozbiorowych Polski przed 1918 rokiem, trafili do różnych krajów; niektórzy powrócili do odrodzonej Polski, niektórzy osiedlili się w Niemczech, Francji, w USA, Wielkiej Brytanii i innych krajach. Pojedynczy album to dziś za mało, ale elektroniczna wersja cyfrowa może być oglądana przez wielu.

Co prowadzi nas do pytania: jak stworzyć trwały, długowieczny album elektroniczny?

Około 15 lat temu zainstalowaliśmy internetowy program otwartego oprogramowania, Gallery2, który zawierał wszystko co niezbędne do zbudowania kolekcji albumów online. Używaliśmy programu Picasa do porządkowania i opisywania zdjęć. Dziś Gallery2 i Picasa już nie istnieją (lub nie są obsługiwane, co oznacza prawie to samo). Poniżej opiszemy nasze starania o odbudowę albumów tak, aby mogły przetrwać przynajmniej przez jedno pokolenie (lub, powiedzmy, 25 lat).

Jak możemy przewidzieć przyszłość, nawet na 25 lat, w szybko zmieniającym się krajobrazie cyfrowego świata? Jednym z czynników, który pomoże (i poprowadzi nas), jest silny konserwatyzm programistów lub budowniczych skomputeryzowanych systemów. Weźmy na przykład Unicode, uniwersalny alfabet lub mechanizm do reprezentowania znaków słowa pisanego w prawie wszystkich językach używanych dzisiaj. Będziemy o tym pisać dalej, ponieważ bez Unicode nie można naprawdę opisywać zdjęć, na przykład reportażu z podróży z Łodzi do Częstochowy do Hajdúböszörmény do Škofja Loka do Besançon do Logroño. Unicode ma około 25 lat, ale nie był pierwszym kodowaniem liter, wcześniej w komputerach dominował kod ASCII alfabetu łacińskiego. Obecnie wiele programów i systemów, nawet zbudowanych całkiem niedawno, nadal nie zapewnia obsługi standardu Unicode. Podobny konserwatyzm wpływa na formaty zapisu zdjęć (grafika rastrowa). Niektóre formaty, takie jak TIFF i JPEG, które wprowadzono 30 lat temu stały się bardzo popularne. Nowe standardy, takie jak JP2, które pod pewnymi względami są lepsze, przyjmują się z dużymi trudnościami.

Cele projektu

Jakie są cele projektu? Zaczynamy od zbioru fotografii w formie cyfrowej. Mogą to być zeskanowane fotografie lub zdjęcia powstałe od razu w formie cyfrowej (born-digital). Obrazy są uporządkowane w albumy lub kolekcje, być może skomponowane na podstawie oryginalnych,  oprawionych albumów lub utworzone od początku. Mamy również metadane: opisy fotografii, osoby, miejsca, daty itp., powiązane z poszczególnymi zdjęciami, a także z albumami lub kolekcjami. Czasem zapisana jest historia albumu i inne wydarzenia związane z tymi zdjęciami.

Celem projektu jest zbadanie i udokumentowanie metodologii zachowania zdjęć, skanów zorganizowanych w opisane albumy tak, by można było je otworzyć i pokazać w przyszłych technologiach online. Chcemy zachować obrazy i metadane dla przyszłych pokoleń, nie dla ulotnego, jednorazowego oglądania (do osiągnięcia dziś w mediach społecznościowych)

Poza zakresem tego projektu jest konserwacja oprawionych papierowych albumów i oryginalnych fotografii, skanowanie i przechowywanie kopii cyfrowych. Tematy te mają mniej lub bardziej obszerną literaturę, chociaż niektóre konkretne tematy mogą być prezentowane na tym blogu później.

Poprawiony (niedziela, 22 kwietnia 2018 19:02)

Więcej…

 

Akta generała Tadeusza Rozwadowskiego dostępne online

Rozkaz operacyjny nr 10000Rozkaz operacyjny nr 10000 do Bitwy Warszawskiej Instytut Piłsudskiego w Ameryce zakończył digitalizację Akt Szefa Sztabu Generalnego Wojska Polskiego generała Tadeusza Rozwadowskiego. Wszystkie dokumenty z tej części naszego archiwum są już dostępne w Internecie. Są one bardzo ważnym materiałem dla historyków i osób zainteresowanych przebiegiem walk z najazdem bolszewickim na Polskę w 1920 roku. Większość dokumentów mówi o tym, co działo się w lipcu, sierpniu i wrześniu 1920 roku. Są wśród nich raporty z dramatycznej sytuacji wojsk polskich cofających się przed Armią Czerwoną i sprawozdania pozwalające odtworzyć przebieg Bitwy Warszawskiej w dniach 15 i 16 sierpnia. Są też relacje pokazujące kolejne fazy polskiego kontrnatarcia i pościgu za bolszewikami. Bezcennym dokumentem jest Rozkaz Operacyjny nr 8358/III Szefa Sztabu Generalnego przedstawiający organizację trzech frontów antybolszewickich i wyznaczający strategiczne zadania dla poszczególnych armii. Bezcenny jest również słynny Tajny Rozkaz Operacyjny nr 10000 z 10 sierpnia 1920 roku napisany własnoręcznie przez generała Rozwadowskiego po dyskusji z Józefem Piłsudskim, wraz ze szkicami sytuacyjnymi przedstawiającymi dwa warianty okrążenia wojsk bolszewickich nacierających na Warszawę. Podpisali się pod nim dowódcy poszczególnych odcinków antybolszewickiego frontu. Kluczowe znaczenie ma też Rozkaz Operacyjny Naczelnego Wodza wydany 15 sierpnia, w którym informuje on o przejęciu przez siebie naczelnego dowództwa. Następnego dnia Piłsudski sam ruszył do walki, kierując uderzeniem znad Wieprza na tyły bolszewickich oddziałów. Kolejne rozkazy oraz odręczna korespondencja Piłsudskiego z Rozwadowskim mówią o wzorowym porozumieniu i współdziałaniu obu tych dowódców. Widać w nich również wielki szacunek i lojalność Rozwadowskiego w stosunku do naczelnego wodza. Piłsudski docenił jego zasługi w postaci awansu na generała broni i oficjalnego listu ze specjalnym podziękowaniem.

Poprawiony (czwartek, 28 września 2017 11:26)

Więcej…

 

Oczyszczanie danych z użyciem OpenRefine

OpenRefineZbieranie metadanych podczas digitalizacji zasobów archiwalnych nie jest prostym zajęciem. Nazwy miejsc, wydarzeń, nazwiska osób wymienianych w dokumentach często różnią się od dzisiejszej pisowni. Nazwy mają różne wersje, aliasy, w dokumentach pojawiają się literówki itp. Co prawda nowoczesne przeszukiwarki jak Google często potrafią rozpoznać często spotykane literówki - jeśli wpiszemy “Kowakski” otrzymamy:

Pokazane są wyniki dla Kowalski
Szukaj zamiast tego Kowakski,

ale działa to najlepiej dla często spotykanych nazw czy imion i dla błędów. W projekcie, w którym chcielibyśmy przedstawić dane jako Linked Open Data, ważne jest mieć czyste dane, bez błędów i z zidentyfikowanymi wersjami, jeśli takie istnieją.

Jako przykład weźmiemy nazwiska (zbieramy także nazwy miejsc, wydarzeń historycznych i inne). Samo imię i nazwisko zwykle nie identyfikuje osoby - może być wiele osób o takim samym imieniu i nazwisku. Kiedy już zidentyfikujemy osobę, często okazuje się, że jej nazwisko występuje w wielu wariantach. Są wersje w różnych językach, osoba mogła używać pseudonimu, przydomka, zmienić nazwisko (przed albo po małżeństwie), dodać tytuły itp. Poddani i obywatele często używają przydomka dla określenie swoich przywódców. Jak znaleźć się w tej gmatwaninie?

Dla osób wymienionych w dokumentach archiwalnych wybraliśmy kilka prostych reguł. Sa one nieco arbitralne, ale służa nam dobrze:

  1. Używamy jednego standardowego imienia i nazwiska dla jednej osoby. Nazwiska alternatywne, wersje w innych językach itp. są notowane także, aby ułatwić wyszukiwanie. Używamy wersji polskiej nazwiska, jeśli to możliwe, i wersji używanej w Wikipedii (polskiej lub w innym języku) jeśli jest to stosowne.

  2. Zapisujemy dane osoby jako “nazwisko, imię (imiona)” w tej kolejności. Nawet ta prosta reguła powoduje czasem trudności, gdyż nie zawsze jest łatwo określić, która część jest imieniem a która nazwiskiem. Wyjątkiem od tej reguły są osoby publiczne takie jak królowie, papieże itp. Dla których podajemy popularne lub oficjalne brzmiene (Mieszko I, Jan Paweł II itp.)

  3. Przypisujemy każdej osobie unikalny identyfikator który generujemy sami. O potrzebie używania unikalnych identyfikatorów mozna więcej przeczytać w blogu, Jeśli to możliwe, korelujemy ten identyfikator z dwoma popularnymi (i w miarę trwałymi) rejestrami: Wikidanymi i VIAF. Spotykamy jednak osoby, o których nikt nie napisał artykułu w Wikipedii w żadnym języku, i w konsekwencji brak im identyfikatora Wikidata. Są osoby które nigdy nie napisały książki i brak jest ich w rejestrze VIAF, który zbiera dane z bibliotek narodowych świata. Dla nich tworzymy krótki opis, dodajemy odnośniki i jak dla innych tworzymy nasz identyfikator.

Następnym etapem jest sprawdzenie zebranych zapisów nazwisk (w chwili obecnej mamy ich około 80 tysięcy) i doprowadzenie ich do standardu. Pracujemy w sekcjach, typowo z danymi jednej kolekcji archiwalnej, ale i tak są to dziesiątki tysięcy rekordów. Można użyć uniwersalne narzędzie - arkusz rozliczeniowy - i wykorzystując takie funkcje jak sortowanie, filtrowanie, wyszukiwanie i zastępowanie wykonać dużą część pracy, Znaleźliśmy jednak bardziej wyspecjalizowany program - OpenRefine - który okazał się być o wiele bardziej przydatny dla wykonania tego zadania. OpeRefine (rozprowadzany jako otwarte oprogramowanie) wyrósł z projektu Google, nazywany wtedy Google Refine (mocno związany z nieistniejącym już projektem Freebase1) i został oddany społeczności otwartego oprogramowania która dalej go udoskonala. OpenRefine został stworzony specjalnie do zadania czyszczenia i udoskonalenia danych.

Poprawiony (czwartek, 20 lipca 2017 16:15)

Więcej…

 

Kolekcja map online

Szkic obrony granic północno ZachodnichInstytutu Piłsudskiego w Ameryce prezentuje kolejną zdigitalizowaną kolekcję : Mapy Online. Prezentacja map na  stronie internetowej Instytutu obejmuje głównie mapy i szkice z zespołu “Adiutantura Generalna Naczelnego Wodza”, ale także mapy z innych kolekcji. Przeglądarka map wyświetla mapę historyczną, ogólny obszar na współczesnej mapie i pozwala na oglądanie dużych map w powiększeniu.

Dostępny jest bardzo ciekawy zestaw oryginalnych map z okresu 1918-1922. Przebieg Bitwy Warszawskiej jest ilustrowany codziennymi szkicami sytuacyjnymi, można zobaczyć przebieg ofensywy bolszewickiej i odwrót Armii Czerwonej po Bitwie Warszawskiej. Są mapy granic, zaplanowane i ustalone traktatami, rozmieszczenie bunkrów i umocnień, pozycje armii niemieckich, sytuacja na śląsku Cieszyńskim i wiele innych szczegółów, jak np. mapa aprowizacji dla frontu litewsko-białoruskiego z 24 lipca 1918. Ciekawa mapa z 1941 roku przedstawia rozmieszczenie ośrodków piątej kolumny w USA (nazistowskiej, komunistycznej i faszystowskiej).

Zapraszamy wszystkich miłośników map.

Marek Zieliński

Artykuł ukazuje się jednocześnie na stronie Instytutu Piłsudskiego w Ameryce

Może Cię też zainteresować:

Poprawiony (czwartek, 20 lipca 2017 15:55)

 

Archiwum Adiutantury Generalnej Naczelnego Wodza w pełni zdigitalizowane

ModlinW dokumentach tych odbijają się zmagania nowego państwa przyjmowanego wrogo, nie tylko przez Niemcy i bolszewicką Rosję, ale także przez Czechy i Litwę...mało znane, zapomniane i niepublikowane dokumenty pokazujące przygotowania podczas Konferencji Paryskiej do Traktatu Wersalskiego, zakulisowe rozmowy dyplomatów, kształtowanie się stosunków Polski z innymi państwami…. materiały pokazujące polsko-niemiecką walkę o Górny Śląsk, Wielkopolskę i Pomorze Gdańskie..Unikatowe materiały pokazują losy wojsk polskich na Wschodzie, nie wyłączając Syberii. Bezcenne są raporty mówiące o Armii generała Józefa Hallera we Francji i jej późniejszych walkach w Polsce... materiały dotyczące najważniejszych osób w państwie...począwszy od Romana Dmowskiego, Józefa Piłsudskiego i Ignacego Jana Paderewskiego...a także dwaj spokrewnieni ze sobą generałowie Hallerowie Józef i Stanisław, Tadeusz Rozwadowski, Ignacy Matuszewski, Kazimierz Sosnkowski, Maurycy Zamoyski, Eustachy Sapieha i inni.

Uprzejmie informujemy, że zakończona została digitalizacja wszystkich dokumentów z kancelarii naczelnika państwa i zarazem naczelnego wodza, którym był Józef Piłsudski. Można teraz do nich dotrzeć drogą internetową z każdego zakątka ziemi. Jest to wielkie ułatwienie dla wszystkich, którzy z najróżniejszych powodów są lub będą zainteresowani historią Polski, Europy i świata w okresie od listopada 1918 do końca 1922 roku. Nie oznacza to jednak, że nie będziemy nadal udostępniać tych dokumentów osobom, które przyjdą osobiście do siedziby Instytutu mieszczącej się na nowojorskim Greenpoincie. Wgląd w nie na miejscu mogą mieć nie tylko zawodowi historycy, badacze z różnych dziedzin i dziennikarze, ale także osoby, które chcą poszerzyć swoją wiedzę historyczną lub dotrzeć do informacji o interesujących je faktach i wydarzeniach. Z kolei osobom nie wiedzącym, jak korzystać z naszych zbiorów w Internecie chętnie pomożemy drogą e-mailową.

Archiwum Adiutantury Generalnej Naczelnego Wodza składa się z 17 tysięcy dokumentów liczących łącznie 40 tysięcy stron. Rzecz jasna  uważne przeczytanie ich, czy choćby tylko przejrzenie, będzie łatwiejsze w Internecie niż w siedzibie Instytutu, gdzie trzeba docierać do kolejnych zbiorów zgromadzonych w tekach i wewnętrznych teczkach, by z kolei dotrzeć w nich do potrzebnych informacji. Na podstawie tychże dokumentów można odtworzyć m.in. dzieje nowopowstałego państwa polskiego, wychodzącego z zaborów i I wojny światowej. Widać w nich wielką radość z odzyskania niepodległości oraz wielkie zmagania o kształt odradzającej się Polski, wydzierającej swe terytoria z rąk zaborców i walczącej o uznanie swej suwerenności przez świat. Widać w nich również nieprawdopodobny wręcz wysiłek połączony z równie nieprawdopodobnymi umiejętnościami, by z trzech zaborów stworzyć jak najszybciej sprawnie funkcjonujące państwo, potrafiące bronić się przed wrogami nacierającymi ze Wschodu, Zachodu i Południa. W dokumentach tych odbijają się zmagania nowego państwa przyjmowanego wrogo, nie tylko przez Niemcy i bolszewicką Rosję, ale także przez Czechy i Litwę, czyli sąsiadów, którzy tak, jak ona uzyskali niepodległość w wyniku postanowień Traktatu Wersalskiego. Nie jest jej sprzymierzeńcem także Wielka Brytania pod rządami Lloyd George’a, obojętnie patrzą na jej los kraje skandynawskie oraz Belgia i Holandia. Francja zaś widzi w niej głównie swego sojusznika w strategii powziętej względem Niemiec i w pewnym stopniu wobec Związku Sowieckiego. Odradzającą się Polskę popiera Ameryka na czele z jej prezydentem Wilsonem, ale jest ona daleko a nieustające zagrożenie ze strony Niemiec i Rosji bolszewickiej całkiem blisko. W tychże dokumentów przebija się również smutna prawda, że wobec nawały bolszewickiej w 1920 byliśmy zupełnie sami, jeśli nie liczyć doradczej i umiarkowanie pomocnej Francuskiej Misji Wojskowej. Fakt, że Polacy uratowali Europę przed inwazją bolszewicką,  owszem, docierał do polityków znających imperialne plany Rosji, ale jakoś szybko o nich zapomnieli.

Poprawiony (poniedziałek, 08 maja 2017 21:43)

Więcej…

 

“Pomiędzy niepewnością a zaufaniem” - wystawa w Bochum

Wystawa o Dipisach w BochumWidok wystawy opublikowany na stronie Zeche Hanower W dniu 16 czerwca 2016 r. otwarta została w Bochum wystawa Pomiędzy niepewnością a zaufaniem - sztuka, kultura i życie codzienne polskich Dipisów w Niemczech 1945-1955.

Po zakończeniu II wojny światowej blisko milion polskich robotników przymusowych, więźniów i jeńców wojennych żyło jako Dipisi (Displaced Persons) w obozach w zachodnich strefach okupacyjnych Niemiec. Dwujęzyczna (niemiecki i polski) wystawa “Pomiędzy niepewnością a zaufaniem” zorganizowana przez Muzeum Przemysłowe “Kopalnia Hanower” stowarzyszenia LWL (Landschaftsverband Westfalen-Lippe) w Bochum ukazuje po raz pierwszy kompleksowy obraz życia codziennego Dipisów i ich działalności kulturalnej. W przygotowaniu wystawy brał udział centrum dokumentacji cyfrowej Porta Polonica, a wystawione dokumenty (kopie) pochodzą w dużej części z archiwum Instytutu Piłsudskiego w Ameryce (Zespół 24, Uchodźcy Polscy w Niemczech).

Marek Zieliński

Artykuł ukazuje się jednocześnie na stronie Instytutu Piłsudskiego w Ameryce

Poprawiony (środa, 27 lipca 2016 21:45)

 

Więcej produktu, mniej procedury

More Product Less Process

ArchiwumOn czasu opublikowania przez Marka A. Greene and Dennisa Meissnera w 2005 wpływowego artykułu More Product, Less Process: Revamping Traditional Archival Processing[1], proponowane w tej pracy rozwiązania zdobywają sobie coraz większe powodzenie wśród archiwistów. Jest to zdumiewające o tyle, że archiwa, instytucje o długiej tradycji, powołują się w pracy raczej na tę tradycje niż na nowinki. Wydaje się jednak, że autorzy tej metodyki, zwanej już popularnie jako MPLP, trafili w dziesiątkę i spowodowali poważne przemyślenia procedur w wielu instytucjach.

Praca ta, dotycząca organizowania i opisywania archiwów, wychodzi z zauważenia zjawiska tworzenia się w archiwach rosnących zaległości w opracowywaniu nabytków. Zaczynając od wyczerpującego przeglądu literatury, autorzy wysłali (i opracowali) ankiety do dużej liczby archiwów (państwowych i prywatnych), do archiwistów, a także dokonali analizy projektów fundowanych przez Narodową Komisję Rekordów i Publikacji Historycznych w USA. Hipoteza roboczą, która została potwierdzona w trakcie badań, było stwierdzenie, że “stosowana powszechnie metodyka obróbki archiwów trwoni cenne środki, ponieważ archiwiści tracą zbyt wiele czasu na zadania które nie muszą być wykonane, albo nie muszą być wykonane w tym momencie”. Autorzy twierdzą, że przez uproszczenie procedur i odłożenie części prac na później, można w znaczący sposób przyspieszyć udostępnienie zasobów badaczom.

Od czasu publikacji wiele archiwów zaczęło stosować wskazania przedstawione w tej pracy, albo przynajmniej uwzględniło niektóre z wniosków przy modyfikacji własnych procedur. Jest dostępnych w Internecie sporo raportów archiwistów opisujących doświadczenia przy wprowadzaniu MPLP w swoich instytucjach. Stowarzyszenie Amerykańskich Archiwistów (SAA) zaczęło oferować regularne kursy akademickie z implementacji MPLP.

Poprawiony (sobota, 05 marca 2016 13:30)

Więcej…

 
Więcej artykułów…
9 czerwca 2017

International Archives Day
Friday 9 June 2018


Materiały MRA
do pobrania

Dawne pismo


Archiwum Narodowe
w Krakowie

Instytut Józefa Piłsudskiego


Instytut
Józefa Piłsudskiego
w Ameryce

NOWOŚĆ


W warsztacie archiwisty

pdf prezentacji

Agnieszki Michalewicz pt.:

Kwalifikacja archiwalnai porządkowanie akt osobowych

– ze szczególnym uwzględnieniem akt osobowych kategorii A.


Ogłoszenia

Wprowadzenie do archiwistyki
stron WWW (warsztat)


organizator Laboratorium
Cyfrowe Humanistyki UW

Warszawa 20 czerwca 2018
zapraszamy!
więcej




NOMA
Norma opisu materiałów archiwalnych
w archiwach państwowych
dostepna na stronie NDAP

Słowniki archiwalne

A Glossary

of
Archival and Records
Terminology

SAA
Online Glossary

Online-Lexikon „Terminologie der Archivwissenschaft“
Terminologie der Archivwissenschaft
Online-Lexikon


Portail International Archivistique Francophone

Portail International
Archivistique Francophone
On-Line Glossaire


ICA
Multilingual
Archival Terminology