장기 데이터 저장: 최고의 매체는 무엇입니까?

Blu-ray 디스크에서 자기 테이프에 이르기까지 기록 보관소는 수세기 동안 지속되는 저렴한 저장 매체를 찾고 있습니다.

내부워싱턴 D.C.의 국회도서관에는 살아있는 타임캡슐이 있습니다. 영화, 방송 및 녹음 음향 부서에서 운영하는 대규모 저장 시설은 밀랍통, 레코드 플레이어 및 기타 구식 시청각 장비로 가득 차 있습니다. 구식 기술의 폐차장으로 볼 수도 있지만 스테파니 바브는 이곳을 "잃어버린 장난감의 땅"이라고 부릅니다.

미 의회 도서관의 IT 서비스 운영 부국장인 Barb는 "우리는 항상 레코드를 틀곤 했습니다."라고 말합니다. 이제 레코드 플레이어를 소유하는 것은 거의 변덕스러운 일입니다.

기계가 노후화되면 보유하고 있는 데이터도 손실될 수 있습니다. 소프트웨어와 하드웨어는 새로운 제품과 서비스로 대체되면서 일반적으로 사용되지 않습니다. Barb와 같은 기술자 및 기록 보관 담당자가 장기간 안전하게 보관하기 위해 정보를 저장하는 과정에서 지속적으로 마주치는 몇 가지 장애물 중 하나입니다. 현재 전문가들은 데이터를 영원히 저장할 수 있는 하나의 저장 장치는 없다고 말합니다. 자기 테이프, 블루레이 디스크, 그리고 심지어 DNA 더 나은 기술이 테스트되고 시장에 출시되는 동안 데이터가 상주할 수 있는 안정적이지만 상대적으로 일시적인 스토리지 뱅크를 제공할 수 있습니다. 그러나 이러한 각 선택에는 고유한 단점이 있으며 용량과 내구성 측면에서 완벽한 방법은 없으며 항상 새로운 혁신이 있습니다.

예를 들어 미국 의회 도서관은 176,000테라바이트의 디지털 공간 보유, 책, 사진, 비디오 및 기타 매체의 웹사이트 카탈로그가 5,350테라바이트(3분 길이의 MP3 파일 약 20억 개에 해당)를 차지합니다. 현재 이 산더미 같은 데이터는 매년 약 1,500테라바이트씩 증가하고 있습니다. 기록 보관 담당자는 중요한 문서와 미디어의 수명을 연장하기 위해 시간과의 싸움을 벌이고 있습니다.

미 의회 도서관의 디지털 전략 책임자인 Natalie Buda Smith는 "보존 프로세스의 일부는 운영 체제와 하드웨어를 최신 상태로 유지하는 것입니다."라고 말합니다.

영원한 것은 없다

단종된 LP 레코드 및 게임 콘솔과 같은 오래된 매체에 파일을 보존하려면 약간의 DIY 수정이 필요합니다. 도서관에서 기록 보관 담당자는 빈티지 미디어 플레이어를 재구성하여 데이터를 복구하고 보다 현대적인 스토리지 형태로 전송합니다. 때로는 팀이 전문 기술을 개발하기도 합니다. 예를 들어, 도서관이 Lawrence Berkeley National과 공동 설계한 IRENE이라는 시스템이 있습니다. 실험실, 깨진 축음기 레코드의 홈 깊이를 읽어 음악을 디지털로 변환 체재.

구식 녹음 장비가 많은 선반
테이프 데크, 레코드 플레이어 및 기타 빈티지 데이터 읽기 도구가 "잃어버린 장난감의 땅"을 채웁니다. 국회 도서관

이것은 저작권이 있는 자료의 경우 특히 중요하다고 Barb는 말합니다. 책은 적절하게 보존된다면 영원히 지속될 수 있지만 DVD, CD 및 DVR과 같이 부패하기 쉬운 자료에 대한 저작권을 위해 제출된 항목은 시간이 지남에 따라 품질이 저하될 수 있습니다. Barb는 "이로 인해 우리는 구식 기술에서 해당 데이터를 추출하고 디지털 방식으로 보존해야 하는 위기에 처하게 됩니다. 거기에 있는 것을 잃게 될 것이기 때문입니다."라고 설명합니다. 모든 저작권 제출과 함께 제공되는 복제본이 있기 때문에 의회 도서관은 일반적으로 보다 현대적인 방법으로 업데이트하려는 의도로 컬렉션에 추가합니다.

작업 백업

미래를 위해 데이터를 보존할 때는 콘텐츠가 존재하는 맥락을 유지하는 것이 중요합니다. “콘텐츠는 '여기 비트가 있습니다'라고 말합니다. 미국 국립 과학 재단(National Science Foundation)의 명예 이사 Ethan Miller는 '이 부분을 이해하는 데 필요한 다른 모든 항목이 여기에 있습니다'라고 말합니다. 스토리지 시스템 연구 센터. 추가 컨텍스트에는 메타데이터, 소프트웨어 및 비디오 게임 에뮬레이터와 같은 하드웨어가 포함됩니다. 그것은 현대의 로제타 스톤에 해당하는 것으로, 과거의 문자와 상징에 의미를 부여하는 열쇠입니다.

현재 수집되고 있는 많은 데이터는 디지털화해야 하는 콘텐츠가 아니라 "디지털로 태어난 콘텐츠"라고 Buda Smith는 말합니다. 인터넷 아카이빙에서 수집된 아티팩트가 좋은 예입니다. 가상 우선 정보는 궁극적으로 테이프와 같은 물리적 매체에 남을 수 있지만 그 과정에서 다양한 다른 저장 형태로 존재할 수 있습니다. 다른 매체에 여러 백업을 저장하는 것도 좋은 방법입니다.

테이프로 함께 보관

도서관은 지금까지 시간의 시험을 견뎌온 수십 년 된 매체인 간단하고 저렴한 자기 테이프에 대부분의 데이터를 보존합니다. 이 재료는 밀도, 데이터 쓰기 속도 및 저렴한 비용으로 높이 평가되는 Goldilocks 매체입니다.

테이프 스토리지는 1900년대 중반부터 사용되었지만 테이프의 각 인치에 점점 더 많은 데이터 비트를 압축하기 위해 지속적으로 개선되고 있습니다. 회사 IBM이 카트리지당 용량을 두 배로 늘리기 위해 노력하는 것처럼 (최대 45테라바이트까지) 미래를 위한 형식을 유지하면서 새로운 세대에서. 그러나 테이프는 완벽하지 않습니다. 마그네틱 스트립이 손상되거나 과열되면 데이터가 지워질 수 있습니다. 그리고 테이프는 새로운 매체보다 읽기 및 쓰기 속도가 더 빠르지만 테이프에 저장된 데이터는 플래시 드라이브나 하드 디스크 드라이브(HDD)에 저장된 정보만큼 액세스하거나 편집하기가 쉽지 않습니다.

원동력

데이터를 사용하는 방식과 빈도는 가장 적합한 저장 매체에 영향을 미칩니다. IBM의 스토리지 전략가인 Shawn Brume은 클라우드 인프라의 기반인 HDD는 디지털 컬렉션이 있는 소기업을 위한 좋은 시작 솔루션이라고 말합니다. 예를 들어 영화 스튜디오를 예로 들어 보겠습니다.

“우리는 영화를 촬영한 지 거의 25년이 되었습니다. 스타 워즈 속편입니다.”라고 Brume은 말합니다. "디즈니는 디지털 기술로 촬영한 원본 영상을 이전한 적이 없으며 그렇게 하지 않을 것이라고 밝혔습니다." 그것은 ~ 때문에 하드 드라이브에 보관하면 영화 제작자가 변경을 원할 때마다 영상을 자르거나 영상을 삽입할 수 있습니다. 쉽게.

그러나 HDD는 시간과 규모에 따라 비용이 더 많이 들기 때문에 자율 주행 차량과 같이 대량의 데이터를 지속적으로 내보내는 시스템에서 비용이 많이 드는 번거로움이 발생한다고 Brume은 덧붙입니다. 그만큼 평균적인 무인 자동차 시스템은 연간 400테라바이트 이상: 수백만 대의 자동차가 모두 동일한 작업을 수행한다면 회사는 HDD에 의해 쉽게 압도당할 것입니다. 업계 전반에 걸쳐 저장하는 데 드는 총 비용 Brume에 따르면 HDD 고밀도 스토리지(인프라 운영 비용 포함)의 데이터 1테라바이트는 월 약 $0.70에서 약 $0.80입니다. 테이프의 경우 월 $0.08 ~ $0.12로 훨씬 저렴합니다. 따라서 이 방법을 사용하면 결국 정보를 테이프로 마이그레이션하여 더 저렴하고 장기적인 오프라인 저장이 필요합니다. Brume은 "이것은 수집, 대조, 조정 및 테이프로 복사하는 과정입니다."라고 말합니다.

역사를 보면 동굴 벽에 새겨진 것 외에는 영원한 매체가 없었습니다.

Shawn Brume, IBM의 스토리지 전략가

IBM은 미래에 데이터를 검색해야 하는 경우 HDD에서 장기 테이프 인프라로 데이터를 이동하는 방법에 대해 회사에 조언합니다. 그러나 하드 드라이브와 달리 테이프의 단점은 변경하기가 매우 어렵다는 것입니다. 단 하나의 디테일을 바꾸고 싶어도 모든 것을 지우고 다시 써야 합니다.

공간을 만들기 위한 경쟁

자주 간과되는 경쟁자가 영구 스토리지 경쟁에서 곧 테이프와 클라우드 스토리지를 앞서게 될 것입니다. 많은 전문가들은 Blu-ray 또는 폴리카보네이트 광 디스크가 손대지 않은 상자에 수십 년, 어쩌면 수백 년 동안 데이터를 보존할 수 있는 엄청난 가능성을 보여준다는 데 동의합니다. 판독기의 보라색 레이저에서 이름을 따온 이 시스템은 부품이 마모되지 않기 때문에 플래시나 하드 드라이브보다 우위에 있다고 Miller는 설명합니다.

그것은 모두 기본 역학으로 귀결됩니다. HDD는 주문을 위해 전원이 꺼진 후 잘 읽거나 쓰지 않습니다. 마찬가지로 플래시 드라이브는 수명이 제한되어 있습니다. 장치의 트랜지스터에 있는 전자가 사용하면서 누출되어 장벽을 통과하고 몇 개월 및 몇 년에 걸쳐 재료의 전하를 변경하기 때문입니다. "즉, 플래시를 자주 읽고 데이터를 다시 작성해야 한다는 의미입니다."라고 Miller는 말합니다.

Blu-ray가 탁월 할 수있는 곳입니다. Miller에 따르면 디스크를 스캔하는 데 필요한 기술은 구성이 비교적 간단합니다. 기본적으로 회전하는 모터, 들어가고 나가는 판독기, 저전력 레이저입니다. 광학 드라이브는 자기 테이프에 사용되는 것보다 훨씬 더 간단합니다. 드라이브당 50~200달러의 낮은 가격대도 거래를 유리하게 만듭니다.

Miller에게 데이터를 저장할 위치에 대한 질문은 어떤 기술이 저장될 것인지에 대한 질문으로 귀결됩니다. 100년에서 1,000년 안에 읽을 수 있습니다. Blu-ray 또는 유리와 같은 더 실험적인 형태의 저장 장치에서 읽을 수 있습니다. 그리고 DNA.

"역사를 살펴보면 동굴 벽에 새겨진 것을 제외하고는 영원한 매체가 없었습니다."라고 Brume은 말합니다. 그러나 그 정보조차도 부식됩니다. 돌, 종이, 암호와 같은 기록 보관을 위한 모든 새로운 발명과 함께 지식은 여전히 ​​전승되고 다음 장소로 번역되어야 했습니다. "우리는 항상 데이터를 관리해야 했습니다."라고 그는 덧붙입니다. "영원한 사례는 없었습니다."

더 읽어보기 팝사이+ 이야기.

최신 블로그 게시물

실리콘밸리에서 거대 식충식물 발견
September 04, 2023

Yahoo! 먹이를 소화하고 용해시킵니다. 야후! 함정 트랩으로 알려진 액체로 채워진 깊은 구멍을 특징으로 하는 먹이 트랩 메커니즘을 갖춘 식충 식물입니다.Flickr, Tumblr 및 Del.icio.us와 같은 스타트업은 종종 안토시아닌 색소 및 꿀 뇌물과 ...

훈련 기술: 온라인 코치 검색
September 04, 2023

가장 예상치 못한 장소인 The Old Grey Lady에서 온라인 마라톤 훈련 계획을 찾는 방법. 편집자 Mike Haney는 그가 얻을 수 있는 고급 달리기 기술의 모든 도움을 받아 뉴욕시 마라톤을 위해 훈련하고 있습니다. 여기에서 그의 이전 게시물을 읽어보...

2014년 최고의 엔지니어링 혁신
September 04, 2023

새로운 것 중 최고입니다. 스카이라인을 바꿀 케이블 코네 울트라로프 도시 경관을 좌우하는 모든 물리적 제약 중에서 가장 직관에 반하는 것은 아마도 엘리베이터 케이블일 것입니다. 매우 긴 표준 케이블은 운반하기에는 너무 무거워져 건물 높이를 제한하는 제한 사항...