banner
홈페이지 / 블로그 / 기계 학습
블로그

기계 학습

Jun 02, 2024Jun 02, 2024

과학 데이터 10권, 기사 번호: 558(2023) 이 기사 인용

301 액세스

1 알트메트릭

측정항목 세부정보

우리 연구에서 우리는 딥 러닝에 적합한 마야 고고학의 원격 감지를 위한 다중 모드 주석 데이터 세트를 수집하기 시작했습니다. 데이터 세트는 유카탄 반도 중앙에서 가장 큰 고대 마야 도시 중심지 중 하나인 Chactún 주변 지역을 다루고 있습니다. 데이터 세트에는 항공 레이저 스캐닝(ALS) 데이터의 래스터 시각화 및 캐노피 높이 모델, Sentinel-1 및 Sentinel-2 위성 데이터, 수동 데이터 주석 등 5가지 유형의 데이터 기록이 포함되어 있습니다. 수동 주석(바이너리 마스크로 사용됨)은 연구 영역 내의 세 가지 다른 유형의 고대 마야 구조(클래스 라벨: 건물, 플랫폼 및 아구아다 – 인공 저수지), 정확한 위치 및 경계를 나타냅니다. 데이터세트는 객체 인식, 객체 위치 파악(감지), 의미론적 분할을 위한 CNN(컨벌루션 신경망)을 포함한 기계 학습에 사용할 준비가 되어 있습니다. 우리는 더 많은 연구팀이 Maya 고고학 조사를 위한 자체 컴퓨터 비전 모델을 개발하거나 기존 모델을 개선하는 데 도움이 되도록 이 데이터 세트를 제공하고 싶습니다.

항공 레이저 스캐닝(ALS) 조사는 전통적인 고고학 경관 조사를 크게 가속화하고 확장했기 때문에 특히 고대 마야의 숲이 우거진 지역에서 고고학 "유적" 분포에 대한 지식을 발전시키는 데 중요한 것으로 입증되었습니다. 조경 고고학에서 ALS의 연구 사용에는 일반적으로 정착, 도시화, 농업 생산 및 농업 생산의 매핑 및 분석을 포함하되 이에 국한되지 않는 다양한, 일반적으로 상호 관련된 상황에 대한 자연 및 문화적 특징의 식별, 위치화, 기록 및 조사가 포함됩니다. 물 관리4,5,6,7,8,9,10,11.

고고학자들은 일반적으로 표면 특징에 대한 인식을 향상시키는 래스터 시각화 형태로 ALS 데이터를 검사합니다. 인간의 시각적 분석과 디지털화에는 시간이 많이 걸리며 세부 수준, 구조 수 및 기록 방법에 따라 수백 평방 킬로미터를 조사하는 데 몇 달이 걸릴 수 있습니다. 고대 마야 지역의 공개적으로 이용 가능한 대규모 고해상도 ALS 데이터 세트가 부족함에도 불구하고 분산된 민간 및 공공 자금을 통해 몇 평방 킬로미터에 걸쳐 현장별 경관 연구를 수행할 수 있을 뿐만 아니라7,15,16 ,17,18 뿐만 아니라 수백 또는 수천 평방 킬로미터에 걸친 대규모 연구(예:3,5,11,19,20,21,22,23)도 있습니다. 데이터의 양으로 인해 전체 데이터 세트에 주석을 다는 것이 어렵습니다. 특히 개체의 위치뿐만 아니라 모양도 표시해야 하는 경우 더욱 그렇습니다. 인간의 육안 검사 및 디지털화의 주관성과 인간 통역사 간의 가변성도 문제입니다24. 따라서 고고학적 물체를 찾고 그 경계를 자동으로 묘사할 수 있는 컴퓨터 비전 방법을 사용해야 하는 긴급한 필요성이 있습니다25,26. 다양한 기계 학습 접근 방식 중에서 심층 합성곱 신경망(CNN)은 현재 컴퓨터 비전의 최첨단 기술이지만 일반적으로 훈련을 위해 이미 레이블이 지정된 대량의 샘플이 필요합니다27. 이로 인해 레이블이 지정된 데이터 세트는 방법을 개발하고 테스트하는 데 중요합니다.

이전 연구 중 하나에서 우리는 CNN이 DEM 시각화에서 고대 마야 고고학 물체를 분류하여 최대 95%의 정확도를 달성할 수 있음을 이미 입증했습니다28. 그러나 분류 모델은 의미론적 분할이 필요한 수동 검사 및 라벨링을 대체할 가능성이 없습니다. 의미론적 세분화는 원격 감지에 쉽게 적용되며27, CNN이 종종 전문가보다 성능이 뛰어난 의료 영상에서는 더욱 그렇습니다29,30,31,32,33,34.

유카탄 반도 중앙 저지대에서 지금까지 알려진 가장 큰 고대 마야 도시 중심지 중 하나인 Chactún 주변 지역에서 ALS 데이터를 수집하려는 원래 의도는 물 관리, 농업, 정착 역학 및 사회 정치적인 측면을 더 잘 이해하는 것이었습니다. 이 지역에 살고 있는 고대 마야 조직11,35.

_.tif, where the data source can specify a mask, ALS visualisations (lidar), CHM, or Sentinel data (S1 or S2). The sequential number is a unique identifier of a data record; all files with the same sequential number represent the same geographical area, but differ in the number of pixels (480 × 480 pixels, 240 × 240 pixels or 24 × 24 pixels) and bit depth (8-bit integer or 32-bit float) (Table 7)./p>