New Opportunities and Challenges of Geo-ICT Convergence Technology: GeoCPS and GeoAI

Dongwoo Ryu

doi:10.32390/ksmer.2019.56.4.383

Preview

General Remarks

Journal of the Korean Society of Mineral and Energy Resources Engineers. 30 August 2019. 383-397
https://doi.org/10.32390/ksmer.2019.56.4.383

New Opportunities and Challenges of Geo-ICT Convergence Technology: GeoCPS and GeoAI

Geo-ICT 융합기술의 새로운 기회와 도전: GeoCPS와 GeoAI

Dongwoo Ryu¹^*

류 동우¹^*

¹한국지질자원연구원 지오플랫폼연구본부 Geo-ICT 융합연구팀

^{* Corresponding Author}

License (open-access):

Ⓒ Journal of the Korean Society of Mineral and Energy Resources Engineers. This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License (http://creativecommons.org/ licenses/by-nc/4.0/) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.

ABSTRACT

Cyber-physical systems (CPS) and artificial intelligence (AI), represented as innovative technologies of the 4th industrial revolution, are developing into Geo-ICT, which is ICT convergence technology based on geoscience knowledge. We proposed the contributions of Geo-ICT to both the mining industry and public sector from various perspectives of the 4th industrial revolution. It was confirmed that Geo-ICT could be an alternative to enhance public acceptance through the coevolution of geoscience and civil society. We compared smart factories and smart mining driven by CPS; through this comparison, we defined the concept of GeoCPS and suggested a direction for the development of smart mining technology. In addition, we reviewed conventional AI and cases where it could be applied to geoscience, and addressed the challenging issues of AI and data-driven informatization in geoscience. In particular, we presented a theory-guided data science model as a Geo-AI utilization model that can take into account the process and data characteristics of the geological resources domain and summarize the effects of synergy.

Keywords

GeoCPS

GeoAI

smart mining

theory-guided data science model

4차 산업혁명의 혁신기술로 대표되는 사이버물리시스템(CPS)과 인공지능(AI)은 지질자원 분야 지식기반 ICT 융합기술인 Geo-ICT라는 새로운 기술 영역으로 발전하고 있다. 다양한 관점에서 4차 산업혁명의 의미를 살펴봄으로써 Geo-ICT 융합기술이 산업과 공공분야에 기여할 수 있는 방향을 찾아보았다. Geo-ICT 융합기술이 지질자원 분야와 시민사회와의 공진화에 기여함으로써 공공 수용성을 제고시킬 수 있는 하나의 대안이 될 수 있음을 확인하였다. IoT의 확장된 개념으로서 CPS가 적용되는 스마트 팩토리와 스마트 마이닝의 산업 환경적 차이를 비교하였다. 이를 통해 GeoCPS의 개념적 정의를 내렸고, 국내 자원산업 환경을 고려한 스마트 마이닝의 기술 개발 방향을 제시하였다. 그리고 전통적 AI 방법론과 활용목적별 적용사례를 살펴보고 자원산업의 디지털화와 지질자원 분야 데이터 정보화를 위한 AI의 도전적 이슈들을 짚어 보았다. 특히 지질자원 분야의 프로세스와 데이터 특성을 고려할 수 있는 GeoAI 활용모델로서 이론기반 데이터과학모델을 제시하였으며 시너지 효과를 정리하였다.

키워드

GeoCPS

GeoAI

스마트 마이닝

이론기반 데이터과학모델

MAIN

서 론
4차 산업혁명
4차 산업혁명의 재해석
시민사회와 공공기술의 공진화
GeoCPS
스마트 마이닝과 GeoCPS
ISA-95 레벨과 마이닝 발전 단계
GeoAI
AI와 지질자원 분야 활용 사례
Why GeoAI, not AI
물리모델과 AI의 결합: 이론기반 데이터과학모델
결 론

서 론

세계경제포럼(WEF)에서는 2016 다보스포럼을 통해 현재 제 4차 산업혁명 단계에 접어들고 있으며 미래에 혁신적이고 파괴적인 변화를 가져올 것이라는 점을 강조한 바 있다(Schwab, 2016). 또한 4차 산업혁명을 주도하는 혁신기술로 인공지능(Artificial Intelligence, AI), 메카트로닉스, 사물인터넷(Internet of Things, IoT), 3D 프린팅, 나노기술, 바이오기술, 신소재기술, 에너지저장기술, 퀀텀컴퓨팅 등을 지목한 바 있다. 한편, KCERN1)에서는 4차 산업혁명을 ‘인간을 위한 현실과 가상의 융합’ 혁명으로 정의하고, 4차 산업혁명의 현실과 가상의 융합과정을 데이터화, 정보화, 지능화, 스마트화라는 4단계로 구분하였으며, 사물인터넷(IoT), 생체인터넷(IoB), 클라우드(cloud), 빅데이터(BigData), 인공지능(AI), 0213기계지능(MI) 등 6가지 디지털 트랜스폼 기술을 제시하고 있다(Lee, 2018).

이러한 기술들은 지질자원기술 및 자원산업 분야에서도 다양한 혁신적 시도와 그 가능성을 현실화시키는 데 큰 역할을 하고 있으며 학제의 패러다임 변화에까지 영향을 미치고 있다. 따라서 4차 산업혁명에 대한 해석은 패러다임 전환기에 있는 지질자원기술의 지속가능한 발전과 새로운 역할 및 그 확장성을 찾는 출발점이 될 수 있다.

광물 및 석유·가스자원 산업분야에서 전주기 공정 통합화 및 자동화를 통한 생산 효율화 및 안전 강화는 오래 전부터 주요한 산업적 관심사이자 기술 개발의 주요 목적이 되어 왔다. 광물자원 산업분야에서는 2010년대부터 미래 광업의 형태로 디지털 혹은 스마트 마이닝이라는 개념이 도입되기 시작하였다(McGagh, 2014). 이는 전 주기적 관점에서 각 공정을 연결하고 이를 자동화함으로써 광산 자산을 효율적으로 운영하고 나아가 수익을 극대화하고 개발 환경을 유지하는 데 그 목적을 두고 있다. 앞서 석유·가스자원 산업분야에서는 2000년대부터 디지털 오일필드(DOF, Digital Oil Field)의 개념이 제시되었는데 이는 분야 이론(혹은 기술), 데이터, 엔지니어링과 통합된 작업 흐름 관리 체계가 함께 자동화되어야 가능한 개념이다. 디지털 오일필드는 자동화와 정보 기술의 집합체로서 운영 작업 프로세스의 효율화를 통해 석유·가스자원 자산 관리법에 대한 철학을 변화시켜 왔다(Dickens et al., 2012; Saputelli et al,, 2013).

국내 자원산업의 디지털 변환(digital transforming) 시기에 대비하기 위해서는 디지털 자원산업의 기술 구현 수준을 체계화할 필요가 있다. 이에 본고에서는 관련 기술개발 및 사업화 마일스톤 수립과 기술개발 목표와 대상을 계획하기 위해 ISA2)-95 레벨에 기초한 자원산업의 디지털 변환 수준 정의를 소개하고자 한다.

또한 IoT의 확장된 개념으로서 가상물리시스템(cyber-physical system, CPS)이 적용되는 스마트 팩토리(smart factory)와 스마트 마이닝의 산업 환경적 차이를 비교함으로써 GeoCPS의 개념적 정체성을 찾고자 한다.

그리고 자원산업의 디지털화 및 공공기술 패러다임 변화에 있어 AI는 정보의 지능화 측면에서 매우 중요한데, 지질자원 분야에서의 대표적 AI 활용사례를 살펴봄으로써 이 분야의 새로운 융합기술 가능성을 고찰한다. 더불어 지질자원 분야 특성과 데이터 환경에 따른 GeoAI의 도전적 이슈를 정리하고자 한다.

4차 산업혁명

4차 산업혁명의 재해석

일반적으로 산업혁명을 기계 혁명(제조산업), 전기 혁명(서비스산업), 정보 혁명(지식서비스), 지능 혁명(지능사회) 등 기술 혁신의 과정으로 정의한다. 특히 4차 산업혁명은 IoT, 클라우드, AI 등 다양한 기술들의 융합으로 해석한다. 산업혁명을 단순히 산업이나 기술 혁신의 과정에 국한하여 바라보는 시각은 현재를 이해하고 미래를 예측하는 데 한계가 있다.

4차 산업혁명을 보다 명확히 이해하기 위해 산업혁명을 기술의 관점이 아니라, 생산(기술)과 소비(욕망)의 순환이란 관점에서 욕망과 기술의 공진화 과정으로 해석하는 모델이 제시된 바 있다(Lee, 2018). 이는 Maslow(1943)의 욕구이론에 기초한 ‘KCERN Model’의 해석 관점으로, 인문학적(인간욕망), 경제사회학적(사업지속성), 과학기술적(기술혁신) 관점을 함께 고려하고 있다. 1차 산업혁명을 생존 욕구 충족, 2차 산업혁명을 물질적 욕구 충족, 3차 산업혁명을 온라인 연결을 통한 사회적 욕구 충족, 나아가 4차 산업혁명을 자기표현과 자아실현의 욕구 충족으로 연결하여 해석한다(Fig. 1). 또한 4차 산업혁명을 ‘인간을 위한 현실과 가상의 융합’ 혁명으로 정의하고, 4차 산업혁명의 현실과 가상의 융합과정을 데이터화, 정보화, 지능화, 스마트화라는 4단계로 제시하고 있는데 단계별 핵심기술은 다음과 같다(Lee, 2018):

- (1단계) 현실 세계의 데이터를 수집하여 가상으로 옮기는 과정(IoT)

- (2단계) 수집된 데이터를 가상의 세계에서 빅데이터로 구축하는 과정(클라우드, 빅데이터)

- (3단계) 가상의 세계에서 AI를 가지고 다양한 시뮬레이션을 통하여 예측하는 과정(AI)

- (4단계) AI가 분석한 결과를 아날로그 트랜스폼 기술을 통하여 현실화하는 과정(제어)

4단계의 아날로그 트랜스폼 기술은 현실 물리 세계를 제어한다는 의미로 볼 수 있으며, 산업적 측면에서는 자율주행자동차 및 스마트 팩토리 등의 CPS와 연결시킬 수 있다.

KCERN에서 정의하고 있는 4차 산업혁명은 공공성이 강한 지질자원 기술 및 산업의 미래를 예측하고 관련 기술 발전의 방향을 모색하는 데 도움이 된다.

http://static.apub.kr/journalsite/sites/ksmer/2019-056-04/N0330560408/images/ksmer_56_04_08_F1.jpg

Fig. 1.

Coevolution concept based on the relationship between Maslow’s hierarchy of needs and the industrial revolutions.

시민사회와 공공기술의 공진화

기술과 욕망의 공진화 과정으로서 산업혁명을 바라보는 시각은 시민사회와 공공기술의 공진화로 확장할 수 있다. 최근 과학기술에서 두드러진 특징 중 하나로 오픈소스코드, 오픈데이터, 오픈에세스 등 오픈사이언스를 들 수 있다.

이는 과학기술 분야의 접근성을 높이고 학제 간 융합의 기회를 제공함과 동시에 과학기술에 대한

시민들의 이해도를 높일 수 있다. 나아가 ICT의 발전은 시민들에게 다양한 방식으로 과학기술 분야에 참여할 기회를 제공하며, 이를 통해 방대한 양의 데이터를 수집하고 의사결정에 필요한 유용한 정보를 가공·처리할 수 있다. 대표적인 예로서 스마트폰은 핵심 컴퓨팅 및 통신장치만 제공하는 것이 아니라 가속도계, 디지털 나침반, 자이로스코프, GPS(global positioning system), 마이크, 카메라 등 다양한 내장형 센서 세트도 함께 제공하며, 이는 교통, 의료, 소셜 네트워크, 안전, 환경 모니터링 등 다양한 영역에서 크라우드센싱의 개념으로 발전하여 이미 활용되고 있다(Table 1과 Fig. 2). 이런 변화는 시민이 공공기술 분야에 참여할 수 있는 기회를 열어 주며, 공감할 수 있는 공공서비스에 대한 기대 수준을 높인다.

Table 1. Representative crowdsensing applications and their characteristics

Applications	Project or App	Summary	Function or Characteristics	Reference
Transportation	VTrack project	A system for travel time estimation 25 GPS/WiFi equipped cars, 800 hours		Thiagarajan et al., 2009
	Mobile Millennium	From 2008 GPS Mobile app: 5000 users, 1 year	Using machine learning to infer traffic conditions for large metropolitan areas from crowdsourced data	Hunter, et al., 2011
	TrafficSense	Predictive multimodal personal mobility assistant Users: Small test groups Cities/countries: 3/1	User contributes to smoother and more sustainable traffic and transportation for all	Heiskala et al., 2016
Environmental monitoring	CitySee project	From 2011 A real-time CO₂-monitoring system using sensor networks for an urban area around 100 km² (Wuxi City, China)	Measuring the carbon absorbance and emissions, supporting the government's policy decision in energy saving and emission reduction, and offer citizens with convenient daily living services.	Liu et al., 2013
	SONYC	A system for monitoring, analyzing, and mitigating urban noise pollution (New York, U.S.)	Leveraging the latest in machine learning technology, big data analysis, and citizen science reporting	Bello et al., 2019
	PEIR (Personal Emergency Information Report)	App uploads GPS signal and motion classification and server combines data such as GPS traces, GIS maps, weather data, traffic data, vehicle emission modeling	Personal Environmental Impact Report (CO and PM2.5 emission impact analysis, PM2.5 exposure analysis)	Mun et al., 2009
Earthquake monitoring	ESA (Emergency Situation Awareness)	All-hazard information are captured, filtered and analysed from Twitter	Alert monitoring, impact assessment visualisation, incident report visualisation	Yin, J. et al., 2012, Robinson et al., 2013
	MyShake (Android) / MyQuake (iOS)	From 2016 downloaded by nearly 200,000 users 8,000 phones/day are providing data		Kong et al., 2016
	Earthquake early warning(EEW)	Demonstration of the EEW via crowdsourcing through controlled test of consumer devices, simulated data and real data	Mw (moment magnitude) 7 earthquake on California's Hayward fault, and real data from the Mw 9 Tohoku-oki earthquake	Minson et al., 2015
	Earthquake network project	From 2013 Real-time alerts on earthquakes detected by the smartphone network Real-time earthquake reports from users	Automatically sending your coordinates to a list of trusted contacts	Finazzi, 2016

http://static.apub.kr/journalsite/sites/ksmer/2019-056-04/N0330560408/images/ksmer_56_04_08_F2.jpg

Fig. 2.

Sensors available inside smartphone and crowdsensing procedures using mobile devices.

지질자원 분야가 제공하는 공공기술은 수요기반 기술로 전환되어야 하며, 새로운 역할과 서비스를 통해 공공수용성(public acceptance)의 제고에 기여할 수 있어야 한다. 지진과 같은 지질재해와 관련하여 그동안 모션 플랫폼을 통한 단순 체험 학습이란 서비스에서 나아가 가상현실(VR, virtual reality) 기술과 지진공학 및 지구물리학과 같은 지식기반 콘텐츠를 결합하는 시도가 필요하다. 이로써 위치, 주거 환경 및 생활객체와 같은 비구조 요소 등 다양한 시민들의 생활환경을 반영한 가상공간에서 실감도 높은 지진 대응 훈련 서비스를 제공할 수 있다. 또한 지질학, 지구물리, 지진공학 및 지반공학과 같은 과학기술분야 지식(domain knowledge)을 기반으로 온라인 상 사용자 환경 정보를 통해 생활환경 내 지진에 대한 취약성을 평가해주는 서비스도 제안할 수 있다(Fig. 3).

지질자원 분야가 지닌 공공성은 시민사회의 요구와 함께 공진화를 통해 강화될 수 있으며, 4차 산업혁명의 혁신 기술과 지질자원 분야 지식의 융합화를 가속화시키는 계기가 된다.

http://static.apub.kr/journalsite/sites/ksmer/2019-056-04/N0330560408/images/ksmer_56_04_08_F3.jpg

Fig. 3.

Earthquake virtual drilling system and on-line service model based on image recognition (e.g., YOLO) and particle-based simulation (e.g., DEM).

GeoCPS

스마트 마이닝과 GeoCPS

IoT는 실세계(real world)의 디지털화 과정이며, 빅데이터는 디지털 데이터의 정보화 과정으로, AI는 정보의 지능화 과정으로 각각 이해할 수 있다. 이러한 전체 과정은 실세계 현상의 분석과 이해 및 예측에 그 목적이 있다.

이러한 혁신 기술의 발전과 함께 4차 산업혁명의 중심에 있는 CPS는 디지털화 및 정보화 과정을 통해 내린 의사결정이 다시 현실 세계로의 아날로그화를 통해 의사결정, 제어 및 조정 과정이 추가된 스마트화의 개념이다. CPS에서는 실제 물리환경에서 관측된 방대한 자료를 이용하여 실제 물리환경과 유사한 가상환경을 구축하고, 가상환경 내에서의 다양한 분석 및 예측을 통해 실제 물리환경에서 필요한 최적의 문제해결 방안을 도출할 수 있다. 이는 제조업 분야의 스마트 팩토리(smart factory), 교통 분야의 자율주행 시스템(autonomous driving system), 자원산업 분야의 디지털 마이닝(digital mining) 혹은 스마트 마이닝(smart mining) 등으로 적용되고 있다.

일반적으로 광산은 제조업 공장과는 다른 특수성을 지니고 있다. 스마트 팩토리가 적용되는 제조업 공장은 고정형 기반시설로 비교적 공정별 설비의 불확실성이 낮고 각 설비의 계측이 용이하며, 오랫동안 검증된 유효한 프로세스 모델에 기초하여 운영되는 특징이 있다. 반면 광산은 고정된 설비와 함께 거대한 모빌리티 장비가 하나의 독립적 개체로 운영되고 있으며, 광체를 포함한 지질, 기후, 환경 등과 관련된 다양한 불확실성에 항상 노출되어 있다. 또한, 변화하는 지형 및 지질 환경 내 경험적 프로세스 모델이 적용되고 있다. 따라서 이와 같은 지질자원 분야의 특수성이 반영되고 기능화된 개념으로 GeoCPS가 필요하다.

GeoCPS는 지구시스템에서 생산되는 대용량의 다양한 데이터를 수집-분석-해석하고, 지구시스템에서 일어나는 현상을 예측하기 위해 지질자원 분야에 기능화 되고 지질자원 지식에 기반한 ICT 융합 기술이며 나아가 지구환경을 제어할 수 있는 시스템을 목표로 한다. 이와 같은 GeoCPS를 통해 기존 전통적인 광물자원 생산공정을 실시간으로 제어함으로써 생산비용을 절감하고 효율성을 향상할 수 있으며, 스마트 마이닝과 가상광산을 구현할 수 있다.

스마트 마이닝은 고도의 엔지니어링과 IoT, 빅데이터, AI를 통해 광산의 전주기 운영에 관여하는 모든 요소가 서로 연결되어 있다. 그리고 디지털 정보화 및 지능화가 가능하여 생산, 안전, 책임, 환경 유지 및 지역 사회 지원을 포함한 모든 측면에서 최적화된 광산 운영 체계라 할 수 있다. 국내 자원산업의 경우 가행광산 원격관리 및 공정최적화를 위한 토탈솔루션의 개념보다는 근접 경보 시스템(proximity warning system), 맞춤형 통기시스템(ventilation on demand), 센싱기반 광석처리 O&M(operation & maintenance), 3D 지질모델 등 광산 프로세스 단위별 안전 확보 및 운영 효율화를 목표로 하고 있다(Fig. 4).

http://static.apub.kr/journalsite/sites/ksmer/2019-056-04/N0330560408/images/ksmer_56_04_08_F4.jpg

Fig. 4.

Solutions for smart mining.

유사한 개념인 가상광산(virtual mine)은 물리세계가 투영된 가상환경을 만드는 디지털트윈 개념으로 이해할 수 있다. 광산의 가상화를 위해 광산을 구성하는 요소(entity)는 ① 광산을 포함하는 지형구조, 지질구조 그리고 광체(품위 분포 포함) 등의 지질 개체, ② 개별 기계장비, 운송유닛, 광산 작업자들 등의 모바일 개체, ③ 사면, 갱도, 고프(goaf), 작업장 등 광산 구조 개체, ④ 갱내의 가스, 미세먼지, 지하수 등 광산 환경요소 개체, ⑤ 환경관련 설비 개체 등으로 분류할 수 있다(Table 2). 가상광산은 실제 광산을 구성하는 각 개체들을 컴퓨터(사이버) 상에 사상한 복제체(twin entity)들의 집합으로 재구성할 수 있다. 그리고 이를 이용하여 사이버 공간 상에서의 다양한 환경 및 채광 시나리오에 따라 시뮬레이션을 수행함으로써 전주기 광산운영을 최적화 할 수 있다.

Table 2. Mining entity classification for digital twining

Main groups for a mine system				Fixed and ancillary groups
Geologic entities	Mine structure entities	Mobile entities	Mine environmenta l entities	Mineral processing entities	Sensor/ Data collector	Network/ Communications
• Ore body • Ore contents • Geologic structure • Geology	• Working face • Goaf area • Gangway • Shaft	• Mine truck • Vehicle • Mining machinery	• Gas (inflammable, vapor) • Groundwater • Dust concentration	• Crusher • Conveyor • Silo • Leaching unit	• Sensors and data collectors attached to mobile entities, mine structure entities etc.	• AP • Antenna • Router • Node

ISA-95 레벨과 마이닝 발전 단계

ISA-95는 제조업의 생산공정 감지(레벨 1)에서 ERP 솔루션(레벨 4)까지 4단계를 포괄하는 표준 기술 아키텍처로서 프레임워크와 관련된 용어로 정의된다(ANSI/ ISA-95.00.01, -95.00.02, -95.00.03, -95.00.05). 레벨 1은 생산공정 감지 및 생산공정 조작을 목적으로 공정에 영향을 미치는 주요 인자(예: 유동, 온도 또는 압력), 즉 단변량 계측과 공정 조정 기술을 의미한다. 레벨 2는 공정 계측 시스템 간 그리고 데이터 관리 시스템과 모델링 시스템 간의 연결 기능을 통해 생산공정을 관리·감독하는 자동화 설비 시스템이다. PLC(programmable logic control)과 SCADA (supervisory control and data acquisition) 시스템을 활용할 수 있으며, 이 시스템들은 공정을 시각화하고 제어 시스템을 통해 공정과의 상호 작용을 제어하는 역할을 한다.

레벨 3은 PAT(process analytical technology) 데이터 관리 시스템으로 작업 흐름과 제조법 제어, 공정의 단계화를 통한 최종 제품 생산에 관여하며, 공정별, 시간/분/초 단위별 기록의 유지 및 생산 공정 최적화를 지원한다. 레벨 4는 생산, 자재 사용, 납품 및 출하 등 기본 생산 일정을 수립하고 재고 수준을 결정하는 ERP(enterprise resource planning) 솔루션을 의미한다.

일반적으로 광산 개발에서 판매까지의 일련의 과정은 광구 확보, 광산 설계, 계획 수립, 천공/발파, 적재/운송, 비축, 분쇄, 처리, 운송, 판매 등으로 단계화할 수 있다. ISA-95 프레임워크에 따라 마이닝의 발전 단계를 분류할 수 있다(Fig. 5). 디지털 마이닝은 ISA-95 레벨 3에 해당하는 것으로 전주기 지질자원 분야 지식과 IoT 및 AI 기술이 적절한 통신환경 하에서 융합되어 하나로 체계화되는 과정을 통해 구현 가능하다.

http://static.apub.kr/journalsite/sites/ksmer/2019-056-04/N0330560408/images/ksmer_56_04_08_F5.jpg

Fig. 5.

Technologies for smart mining and ISA-95 levels (modified from Accenture, 2019).

국내 자원산업의 환경과 초기 투자비를 고려할 때 전체 시스템을 구축하기보다는 광산보안 분야와 개발, 처리, 운송 등 각 공정 단계별로 맞춤식 스마트화를 진행시키는 것이 효과적일 것이다. 또한 국내 광산의 높은 외산장비 의존성을 고려했을 때 완전 무인화의 목표보다는 장비 간 혹은 장비와 작업자 간 맞춤형 커넥티드 마이닝(connected mining)의 구현이 보다 현실적이다. 이를 위해 현재 구축되어 있는 유선망과 무선 네크워크 간 통합화와 같은 갱내 통신 네트워크 효율화 및 갱내 무선 통신 가이드라인 재정이 선행될 필요가 있다.

GeoAI

AI와 지질자원 분야 활용 사례

AI는 학습, 문제 해결, 패턴 인식 등과 같이 주로 인간 지능과 연결된 인지 문제를 해결하는 데 주력하는 컴퓨터 공학 분야로 학자들마다 다양하게 정의하는 면이 있다. Bellman(1978)은 인간의 사고, 의사결정, 문제 해결, 학습 등의 활동과 연관 지을 수 있는 자동화로 정의했으며, Kurzweil(1990)은 인간이 지금까지 해 왔던 기능적인 작업들을 대신할 수 있는 기계의 제작을 위한 기술이라고 하였다. 또한 Winston(1992)은 인지와 추론, 행위를 가능하게 하는 연산에 대한 연구로 정의한 바 있다. 최근 과학기술정보통신부 4차산업혁명위원회는 AI를 인지, 학습 등 인간의 지적능력(지능)의 일부 또는 전체를 ‘컴퓨터를 이용해 구현하는 지능’이라고 정의했다(Ministry of Science and ICT, 2018). 이를 종합하면 AI는 인지, 추론 등을 통한 학습과 문제해결 등 인간의 사고 능력을 기계적으로 구현하여 자동화한 시스템을 의미한다.

일반적으로 공학에서 정의하는 프로그램이란 특정 목적을 위해 만들어진 소프트웨어에 인간이 알고리즘을 구상하여 입력한 그대로 행동하는 것인 반면, AI는 기계 스스로 학습하여 최적의 알고리즘을 만들어 나가는 것을 의미한다. AI의 기법은 크게 지도학습(supervised learning)과 비지도학습(unsupervised learning) 그리고 강화학습(reinforcement learning)으로 분류할 수 있다(Fig. 6).

http://static.apub.kr/journalsite/sites/ksmer/2019-056-04/N0330560408/images/ksmer_56_04_08_F6.jpg

Fig. 6.

AI methods and their applications (modified from Bergen et al., 2019).

지도학습으로 분류할 수 있는 기법에는 로지스틱 회귀(logistic regression), 그래프 모델(graphical model), SVM (support vector machine), RF(random forest), 인공신경망(artificial neural network, ANN), 심층신경망(deep neural network, DNN) 등이 있다.

로지스틱 회귀는 독립변수와 이항의 종속변수 간의 관계를 함수로 표현한 모델이라 할 수 있다.

그래프 모델은 시계열적 의존성이 높은 지구과학 데이터를 다루는 데 특화된 기법으로서 순차적 자료를 모델링하는 데 적용된 HMM(hidden Markov models)이 대표적이다.

SVM은 주어진 학습 데이터를 비선형 매핑을 통해 고차원으로 변환한 후, 새로운 차원에서 초평면(hyperplane)을 최적으로 선형 분리하여 가장 적합한 의사결정 영역(decision boundary)을 찾는 기법이다(Cortes and Vapnik, 1995).

일반적인 의사결정나무(decision tree)는 의사결정규칙과 그 결과들을 트리 구조로 도식화한 지도학습 기법이다. 그런데 RF는 다수의 의사결정나무들을 생성한 다음, 각 개별 트리의 예측치들 중에서 가장 많은 선택을 받은 클래스(또는 label)로 예측하는 알고리즘으로서 앙상블(ensemble) 학습 방법의 일종이다(Cracknell and Reading, 2013; Cracknell and Reading, 2014).

ANN은 1960년대의 퍼셉트론(perceptron) 알고리즘에서 출발하여 다층구조 형태의 신경망 기반의 심층 아키텍처인 딥러닝(deep learning)에 이르기까지 60년 이상의 긴 연구 역사를 지니고 있다(Goodfellow et al., 2016). ANN은 일련의 가중치로 연결된 노드(뉴런) 집합으로 표현되며, 입력층, 은닉층, 출력층으로 구분된다. ANN의 비선형 관계 모델링이라는 강점으로 인해 다양한 지구과학자료에 적용된 바 있다(Van der Baan and Jutten, 2000; Poulton, 2002). DNN 혹은 심층학습은 확장된 ANN 기법으로 일련의 가중치로 연결된 노드(뉴런) 집합으로 표현되며, 입력층, 출력층과 그 사이의 다중의 은닉층으로 구성된다. 심층학습은 지도 및 비지도학습 방법을 포괄하며 다양한 네트워크 아키텍처를 가진 광범위한 기법을 의미한다. 초기 DNN에는 기울기 값 소실 문제(vanishing gradient problem), 과적합(overfitting), 높은 연산량 및 불안정한 학습 등의 문제들이 있었다.

이에 초기 신경망 학습에 사용되었던 sigmoid 함수 또는 tanh 함수 대신 ReLU(rectified linear unit)를 사용하고, 가중치의 초깃값 설정 문제를 DBN(Deep Belief Network), RBM(Restricted Boltzmann Machine) 또는 Xavier 초기화를 활용하여 기울기 값 소실 문제를 해결할 수 있었다. 그러나 학습을 위한 많은 연산량과 과하게 학습하여 실제 데이터에 대한 오차가 증가하는 느린 학습 및 불안정 학습 등의 문제가 발생할 수 있다. 2000년대 이후부터는 드롭아웃(drop-out), ReLU, 배치 정규화(batch normalization) 등의 기법이 적용되면서 딥러닝의 핵심 모델로 활용되고 있다(Fig. 7).

http://static.apub.kr/journalsite/sites/ksmer/2019-056-04/N0330560408/images/ksmer_56_04_08_F7.jpg

Fig. 7.

Perceptron concept and challenges and remedies of the conventional AI.

생성모델은 자료에 대한 결합확률분포를 학습하는 기계학습의 한 종류로 지도학습과 비지도학습 모두에 해당한다. 최근에는 생성적 적대 신경망(generative adversarial network, GAN)에 대한 연구가 활발히 진행되고 있다(Goodfellow et al., 2014). GAN은 서로 반대되는 목적을 가진 두 개의 신경 네트워크인 훈련 자료를 사용하여 모델을 학습하는 생성자 네트워크(generator network)와 실제 훈련 자료와 합성 자료를 구별하는 판별자 네트워크(discriminator network)로 구성된다(Mosser et al., 2017). 심층생성모델의 비지도학습 능력은 라벨을 종종 이용할 수 없는 지구과학의 많은 역산문제를 해결하는 데 특히 효과적인 면이 있다. 또한 신경망을 사용하면 수치 시뮬레이션 모델과 비교하여 합성지진자료 생성에 필요한 계산 비용을 상당량 줄일 수 있다(Krischer and Fichtner, 2017).

비지도학습으로 분류할 수 있는 기법에는 군집분석과 SOM(self-organizing maps), 표상학습(feature learning 혹은 representation learning), 사전학습(dictionary learning)이 있으며, 심층신경망으로 분류할 수도 있는 오토인코더(autoencoder) 네트워크와 심층생성모델(deep generative model)이 있다.

SOM은 차원 감소 또는 군집화에 사용할 수 있는 비지도학습 인공신경망의 일종이다(Kohonen, 2013). 표상학습은 자료에 대한 낮은 차원 또는 희소 특성(sparse feature)을 학습하는 데 사용할 수 있으며, 사전학습은 기본 요소들의 선형 조합 형태로 표현하여 표상을 학습하는 방법이다.

AI는 딥러닝의 발전과 더불어 강력하고 사용이 용이한 기계학습 툴박스 및 오픈소스코드 등으로 지질자원 분야 연구자들의 새로운 관심의 대상이 되어 왔다. 대용량 메모리를 가진 초고속 컴퓨터의 결합, AI 알고리즘의 급속한 발전, 그리고 대용량 자료의 접근 가능성이 높아지면서 지질자원 기술은 진일보할 수 있는 기회를 가질 수 있다. AI 적용을 통한 지질자원 분야의 기술적 진전은 크게 자동화(automation), 모델링(modeling 혹은 역산문제), 그리고 발견(discovery) 등 3가지 범주로 살펴볼 수 있으며(Bergen et al., 2019), 각 범주별 대표적 활용 사례는 Table 3과 같다.

Table 3. Categories and cases of AI application for geoscience

Categories	AI methodology	Application geoscience fields (Objective)	References
Supervised learning
Automation	CNN	Seismology (Earthquake detection)	Perol et al., 2018
	CNN	Volcanology (Classification of volcanic ash)	Shoji et al., 2018
	SVM	Seismology (Earthquake warning)	Ochoa et al., 2017
	ANN	Seismology (Earthquake warning)	Kong et al., 2016
	SVM	Seismology (Earthquake warning)	Reddy and Nair, 2013
Modeling	ANN	Seismology (Building relationship between earthquake and ground motion)	Trugman and Shearer, 2018
	RF and SVM	Hydrology (Flow and transport simulation in porous media)	Valera et al., 2018
	DNN	Rheology (Viscoelastic calculations)	DeVries et al., 2017
	ANN	Seismology (Solving the inverse problem)	Käufl et al., 2016
	RF	Seismology (Building relationship between earthquake and ground motion)	Derras et al., 2014
Discovery	CNN	Seismology (Earthquake classification)	Kang et al., 2019
	Gradient boosted tree	Seismology (Earthquake prediction)	Hulbert et al., 2019
	Gradient boosted tree	Geology and Seismology (Discovering unexpected patterns; Fault's position)	Rouet-Leduc et al., 2018
	RF	Seismology (Earthquake prediction)	Rouet-Leduc et al., 2017, Rouet-Leduc et al., 2019
Discover & Automation	RF	Lithology (Lithological mapping)	Kuhn et al., 2018
Unsupervised learning
Discovery	K-means (unsupervised) and HMM (supervised)	Geology and Seismology (Identification of temporal earthquakes patterns)	Holtzman et al., 2018
	GAN	Hydrology (Reconstruction of porous media)	Mosser et al., 2017
	PCA and SOM	Geology (Geologic pattern recognition)	Roden et al., 2015
	SOM	Geology (Identification and Mapping geophysical data)	Carneiro et al., 2012
	SOM	Seismology (Earthquake detection)	Köhler et al., 2008
Discovery & Modelling	Dictionary learning	Seismology (Development of 2D travel time tomography)	Bianco and Gerstoft, 2017

자동화는 영상인식과 같이 명시적인 일련의 명령어로 설명하기 어려운 복잡한 작업을 수행하는 데 AI를 활용하는 것을 의미한다. 대용량 고차원 데이터 패턴을 처리하고 추론할 수 있는 AI 알고리즘의 강점을 이용하면 지질자원 분야의 대용량 데이터 분석 및 처리과정을 자동화할 수 있다. 특히 지진감지 및 지진 조기 경보와 같이 대용량 데이터 분석 단계를 자동화하거나 화산재 입자 분류와 같은 많은 시간이 소요되는 분석에 있어서 전문적이고 반복적인 작업 수행을 위해 적용된 바 있다(Perol et al., 2018; Kong et al., 2016; Reddy and Nair, 2013; Ochoa et al., 2017; Shoji et al., 2018).

모델링은 데이터 세트 간 관계 및 구조를 파악하는 작업에 AI를 활용하는 것을 의미한다. 지진동 예측을 위해 지진원과 관련한 매개변수와 최대지반가속도(peak ground acceleration, PGA)의 관계처럼 대상 변수와 데이터 간의 복잡한 미지의 관계에 대한 모델을 생성할 수 있다. 또한 전산 시뮬레이션 및 역산문제와 같은 대규모 연산 속도를 높이기 위한 근사 모델로 활용할 수도 있다(DeVries, et al., 2017; Valera et al., 2018; Käufl et al., 2016). 역산문제는 관측 데이터, 연산 모델 및 물리이론을 연결하여 지구시스템을 추론하는 것을 목적으로 한다. 딥러닝은 역산의 비정치성(ill-posedness) 문제를 극복할 수 있는 방안을 제공할 수 있으며 역산문제를 푸는 데 유용한 방법이 될 수 있다(McCann et al., 2017).

데이터에서 새로운 정보를 추출하는 능력은 과학적 응용을 위한 AI의 가장 흥미로운 능력 중 하나이다. 일반적으로 AI는 전통적인 기법들에서 쉽게 드러나지 않는 새로운 패턴이나 구조 및 관계를 발견하기 위한 도구를 제공한다. 또한 이전에 확인할 수 없었던 신호 또는 물리적 프로세스를 나타내거나, 데이터를 표현, 해석하고 시각화하기 위한 주요 특징을 추출하는 데 사용된다(Rouet-Leduc et al., 2017; Rouet-Leduc et al., 2018; Hulbert et al., 2019; Rouet-Leduc et al., 2019; Valentine and Trampert, 2012; Carneiro et al., 2012; Wu and Hale., 2016). AI는 직관에 반하거나 예기치 못한 패턴을 발견함으로써 편향된 결과를 피할 수 있고, 실험의 설계나 데이터 수집에 효과적으로 기여할 수 있다(Rouet-Leduc et al., 2018; Kuhn et al., 2018).

Why GeoAI, not AI

지질자원 분야에서 다루는 현상(혹은 프로세스)과 데이터가 지닌 특성 및 환경으로 인해 전통적인 AI는 최근의 기술적 발전에 비해 지질자원 분야에 제한적으로 적용되어 왔다. 따라서 지질자원 분야가 지닌 특성에 대한 이해는 지질자원 분야에 기능화 된 AI 혹은 이의 활용 체계에 대한 연구개발 방향을 모색하는 출발점이 될 수 있다. 전통적 AI가 지질자원 분야 활용에서 제한이 있었던 원인은 크게 현상 혹은 대상과 데이터 특성에서 찾을 수 있다.

현상 혹은 대상의 특성은 무정형성(amorphousness), 시공간 구조(spatiotemporal structure), 고차원성(high dimensionality), 시공간적 이질성(heterogeneity), 희소성(scarcity) 등을 들 수 있다(Karpatne et al., 2018).

일반적으로 지질자원 분야에서 다루는 대상의 형태, 구조, 패턴은 시공간 상에서 연속적으로 변화하고 다양한 스케일로 존재한다. 따라서 그 현상 혹은 대상의 경계를 명확히 정의 내리기 어려운 경우가 많은데 이를 경계의 무정형성이라 한다. 현상의 형태, 패턴 및 동적 정보와 이와 관련한 불확실성을 함께 고려할 수 있는 새로운 기법들이 제안되고 있지만(Ravela, 2012; 2015), 무정형성을 지닌 대상이나 현상의 특성을 추출하기 위한 보다 진일보한 방법이 필요하다.

시공간 상에서 발생하는 현상들은 대부분 시공간적 자기상관성(autocorrelation)을 보이는 경우가 많은데 이는 현상마다 시공간 구조(spatiotemporal structure)가 내재하고 있음을 의미한다. 따라서 지구물리학적 현상의 효과적인 모델링을 위해서는 데이터의 시공간적 자기상관성의 이해가 중요하다. 전통적인 AI는 관측된 변수의 독립동일분포(independent identically distributed, iid) 가정 하에서 작동하며, 이는 지질자원 분야에서는 더 이상 유효하지 않을 수 있다.

매우 복잡한 지구시스템 현상의 정확한 예측을 위해서는 서로 영향을 미칠 수 있는 많은 수의 잠재적인 변수들을 동시에 고려해야 한다(Wunsch, 2006). 이들 변수들의 영향을 정밀하게 분석하고 파악하는 과정은 지질자원 분야 데이터의 차원수를 필연적으로 증가시킨다.

대부분의 지질자원 분야 데이터는 시공간적 이질성(heterogeneity)을 보인다. 이는 시공간적 자기상관성 모델이 지역 및 시간에 따라 다를 수 있다는 것을 의미한다. 이는 모든 시공간에서 좋은 성능을 보이도록 AI 모델을 학습시키는 것은 매우 어려운 문제라는 사실을 의미한다.

대부분의 지질자원 분야의 관심 현상은 시공간적으로 드물게 발생하기 때문에 지질자원 분야 데이터를 통해 변화나 현상을 분류하거나 파악하는 것은 현상 관측치 혹은 모니터링 데이터 수가 부족하다는 문제와 직결된다. 또한 현상의 희소성 문제는 데이터의 불확실성 및 편향성 문제를 발생시킬 수 있다.

지질자원 분야 데이터 특성은 다중 해상도(multi-resolution), 불완전성(incompleteness), 한정된 데이터 샘플 수 등을 들 수 있다.

지질자원 분야 데이터 세트는 여러 소스를 통해 다양한 시공간적 해상도로 제공되는데, 이로 인해 샘플링 속도, 정확도, 불확실성과 같은 특성에서도 차이를 보인다. 일반적으로 다양한 해상도의 데이터 세트는 다운스케일링(downscaling)을 적용하여 높은 해상도로 일치시킨다. 하지만 이 과정에서 예기치 못한 불확실성이 개입될 가능성이 있기 때문에 다중 해상도 환경 하에서 주어진 데이터 세트의 패턴을 찾을 수 있게 하는 알고리즘이 필요하다.

지질자원 분야의 관측, 계측, 센싱 환경은 다양한 잡음원에 항상 노출되어 있다. 또한 관심 변량은 직접 측정하기 어려운 경우가 많기 때문에 관련성이 있는 다른 변량을 측정하거나 모델링의 결과로부터 유추하는 경우가 많다. 따라서 지질자원 분야 데이터는 불확실성이 있는 불완전한 데이터이다. 또한 현상의 희소성과 관측 방법의 특성으로 인해 시공간적 데이터 샘플 수가 한정적일 수밖에 없다. 게다가 지구시스템에 발생하는 많은 현상들을 완전하게 규명 혹은 검증할 수 있는 실측자료가 존재하지 않는 경우도 많다.

지질자원 분야에서 다루는 현상(혹은 프로세스)과 데이터가 지닌 특성 및 환경으로 인하여 전통적 AI는 샘플링 편향, 주변 영향 인자의 영향 고려 부족, 통계적 연관성 및 인과관계의 불명확성, 다중가설검증의 근본적 결함 등 여러 한계점을 보인다. 특히 계측 기술의 발달로 시공간 자료에 대한 해석 및 예측의 필요성이 높아지고 있고 탐사기술과 모델링 기술의 발전으로 소프트데이터3)(soft data)의 활용이 매우 중요해지고 있다. 최근 딥러닝 알고리즘의 발전으로 이미지 인식과 같은 공간학습(spatial learning)과 음성인식과 같은 시퀀스학습(sequence learning)은 지구시스템의 2차원 혹은 3차원 현장자료 및 시계열 형태의 동적 자료 처리에 있어 유사 적용이 가능하다.

그런데 딥러닝과 같은 최근의 AI 기술을 지질자원 분야에서 성공적으로 적용하기 위해서는 몇 가지 해결해야 할 과제가 있다. 이에는 인과관계 규명 및 모델 해석(interpretability)의 어려움, 물리적 일관성(physical consistency) 문제, 데이터의 복잡성과 불확실성 문제, 레이블된 자료의 부족, 높은 연산 비용 등을 들 수 있다(Reichstein et al., 2019). 이와 같은 지질자원 분야의 현상과 데이터 환경 특성을 효과적으로 고려할 수 있는 AI 활용 체계를 GeoAI라고 정의할 수 있다.

지질자원 분야의 GeoAI 활용방안으로는 nowcasting(매우 근접한 미래의 예측, 시간 단위의 예측), forecasting(장기간 미래의 예측), 이상감지, 시공간 자료 기반의 지하물성 분류 등을 들 수 있다. 이에는 한정된 자료로부터 최대 학습을 이끌어 내고 최적화된 예측을 수행하면서 동시에 물리적으로도 설명이 가능한 모델을 만드는 것이 필수적으로 동반된다. 이를 가능케 하는 하나의 방안으로 물리모델과 AI가 결합한 융합모델이 있다.

물리모델과 AI의 결합: 이론기반 데이터과학모델

일반적인 과학 영역 문제는 물리적 변수와 물리현상 간의 관계를 표현하는 데 집중되어 있다. 이러한 관계를 표현하는 기존 접근법은 물리모델을 사용하는 것으로서 실험적으로 입증되었거나 원리에서 추론된 변수 간의 인과관계로 정리하는 것이다. 이러한 물리모델은 자연현상과 관련된 지배방정식(governing equation)의 해를 찾는 것을 의미하며, 분석적 접근법과 수치해석과 같은 전산 시뮬레이션 등의 방법이 존재한다. 다른 접근법은 AI모델을 사용하는 것으로 입력(원인) 및 출력(결과) 변수와 관련된 일련의 데이터를 이용하여 변수 사이의 관계를 자동으로 추출할 수 있는 데이터 과학모델을 학습하는 것이다. 물리모델은 자연현상을 설명할 수 있는 알려진 과학적 원리에 기초하여 모델링하기 때문에 개념적으로 이해하기 쉬운 프로세스를 표현하는 데 적합한 반면, 데이터과학모델은 주로 데이터에 포함된 정보에 의존하기 때문에 데이터 샘플이 풍부하게 제공되는 분야에서 광범위하게 적용할 수 있다.

물리모델에 기초한 접근법은 현상에 대한 자연법칙 하에서 직접적인 해석이 가능하며, 모델링의 제약조건을 넘어서는 부분에 대해서는 자연 법칙에 입각한 외삽이 가능하다. 반면에 데이터과학모델은 주어진 데이터에 맞추어 매우 유연하게 모델링할 수 있으며 이론적으로 규명되지 않은 현상을 발견할 수 있다.

각각의 장점에도 불구하고 물리모델과 데이터과학모델은 지질자원 분야에서 다루는 현상(혹은 프로세스)과 데이터가 지닌 특성 및 환경으로 인해 한계성을 보이는 경우가 종종 있다. 특히 지구시스템에 벌어지는 현상들은 본질적인 복잡성으로 인해 현재의 물리모델로는 완전히 설명되지 않는 과정들을 포함하며, 물리적 프로세스에 대한 여러 가지 단순화 가정을 요구하는 어려움이 동반한다. 이는 부정확성을 초래할 뿐만 아니라 모델을 이해하고 분석하기 어렵게 만든다. 데이터과학모델도 모델의 복잡성에 비해 데이터가 부족하고 높은 불확실성으로 인하여 과학적 원리와는 동떨어진 결과를 초래할 수 있다. 또한 다양한 매개변수들의 시공간적 변화는 데이터과학모델의 효과를 저하시킨다.

따라서 물리모델과 데이터과학모델이 상호 보완하기 위해 이론기반 데이터과학모델(theory-guided data science)과 같은 결합된 모델이 필요하다(Karpatne et al., 2017). 이론기반 데이터과학모델은 문제의 일부를 물리모델의 구성 요소로 처리하고 나머지는 데이터과학모델의 구성 요소로 분리하여 모델링하는 방식과 현재 누락되었거나 부정확하게 추정된 물리모델의 중간 결과를 데이터과학 방법으로 예측하여 접근하는 방식으로 구분할 수 있다. 후자의 경우 데이터과학모델의 결과를 편미분방정식(partial differential equation)로 표현되는 물리모델에 제공함으로써 더 나은 예측 성능을 보여줄 뿐만 아니라 기존 물리모델의 결함을 개선할 수 있는데 이를 융합전산해석(physical based and data driven model)으로 정의할 수 있다. 또한 물리모델의 결과를 데이터과학모델의 구성 요소 학습 샘플로 사용될 수도 있으므로 이들 사이에 양방향 시너지 효과를 얻을 수 있다(Sadowski et al., 2016; Long et al., 2018)(Fig. 8).

http://static.apub.kr/journalsite/sites/ksmer/2019-056-04/N0330560408/images/ksmer_56_04_08_F8.jpg

Fig. 8.

An illustration of different modeling approaches for dynamical systems (modified from Long et al., 2018).

지질자원 분야의 특수성을 고려하는 방법으로 이론기반 데이터과학모델 혹은 융합전산해석을 고려할 수 있다. 이를 통해 얻을 수 있는 잠재적 시너지 효과를 다음과 같이 정리할 수 있다(Reichstein et al., 2019).

(1) 매개변수화 개선(improving parameterization): 물리모델은 매개변수가 필요하며, 매개변수는 공리(axiom)로 부터 쉽게 유도하기 힘든 경우가 많다. AI는 공리에 기초한 모델로부터 생성되거나 직접 관측된 데이터로부터 매개변수를 유도하고 학습할 수 있다. 또한 고해상도의 데이터나 모델로부터 적절한 해상도의 매개변수로 변환할 수 있어 모델의 연산효율을 높일 수도 있다.

(2) AI로 하위모델 대체(replacing a ‘physical’ sub-model with AI): 물리모델을 구성하는 하위모델이 물리적 의미에서의 일관성이 부족하고 대신 데이터가 충분할 경우 이를 AI로 대체할 수 있다. 이를 통해 이론적 근거와 데이터를 동시에 만족하는 하이브리드 모델을 생성할 수 있다.

(3) 모델과 관측치의 불일치 분석(analysis of model- observation mismatch): 관찰편향(observational biases)이 없다는 가정 하에서는 물리모델 예측치와 관측치의 차이를 물리모델의 불완전성에 기인하는 모델 오류로 인식할 수 있다. AI를 통해 물리모델에서는 명확히 정의하기 힘든 오류의 패턴을 식별하고 시각화함으로써 모델 결과를 동적으로 보정할 수 있다.

(4) 하위모델 상호조건화(constraining sub-models): 하나의 하위모델을 통해 생성된 데이터는 다른 매개변수 학습을 위한 다른 하위모델의 입력 자료로 활용할 수 있으며, 각 하위모델에서 생성된 자료를 교차하여 입력 자료로 활용함으로써 편향성 감소 효과와 모델 인자의 보정효과를 얻을 수 있다.

(5) 근사 모델 혹은 에뮬레이션(surrogate modelling or emulation): 물리모델이 통합된 AI 에뮬레이터는 물리모델의 정확성을 유지하면서 모델 시뮬레이션 속도를 수십~수백 배 향상시킬 수 있다. 이로써 민감도 분석 모델 생성, 모델의 파라미터 조정, 모델 평가를 위한 신뢰구간 도출 등의 작업이 가능하다.

결 론

4차 산업혁명이 일으킨 새로운 패러다임 변화는 지질자원 분야 기술 및 산업에 있어 기회이자 도전이 될 수 있다. 4차 산업혁명의 혁신 기술과 지질자원 분야 지식의 융합화는 지질자원 기술과 시민사회의 공진화뿐만 아니라 지질자원 분야가 지닌 공공성을 강화시킬 수 있는 기회를 제공한다.

특히 지질자원 분야의 특수성과 기능성을 충족할 수 있는 CPS와 AI의 확장 모델로서 GeoCPS 및 GeoAI의 개념을 제시하였다. 나아가 지질자원 분야 기술 및 산업을 위한 지질자원 기술과 ICT의 학제 간 융합 분야로의 Geo-ICT 발전 가능성을 확인하였다.

디지털 마이닝/스마트 마이닝은 전주기 지질자원 분야 지식과 IoT 및 AI 기술이 적절한 통신환경 하에서 융합되어 하나로 체계화되는 과정을 통해 구현할 수 있다. 국내 자원산업의 환경을 고려할 때 공정 단계별로 맞춤식 스마트화를 진행시키는 것이 효과적일 것이며, 완전 무인화의 목표보다는 장비 간 혹은 장비와 작업자 간 맞춤형 커넥티드 마이닝(connected mining)의 구현이 보다 현실적이다. 이를 위해 현재 구축되어 있는 유선망과 무선 네크워크 간 통합화와 같은 갱내 통신 네트워크 효율화 및 갱내 무선 통신 가이드라인 재정이 선행되어야 한다.

딥러닝과 같은 최근의 AI 기술을 지질자원 분야에서 성공적으로 적용하기 위해서는 인과관계 규명 및 모델 해석의 어려움, 물리적 일관성 문제, 데이터의 복잡성과 불확실성 문제, 레이블된 자료의 부족, 높은 연산 비용 등의 도전적인 과제를 선결해야 한다. 지질자원 이론기반 데이터과학모델은 전통적 AI가 지질자원 분야에 적용될 시 지닌 한계성을 극복하기 위한 AI 활용 모델이 될 수 있으며, 매개변수화 개선, AI로 하위모델 대체, 모델과 관측치의 불일치 분석, 하위모델 상호조건화, 에뮬레이션 등의 시너지 효과를 기대할 수 있다.

지질자원 분야는 지구물리, 지구화학, 석유공학, 암석역학, 자원처리, 지구통계학, 지오메카닉스, 자원경제학 등과 같이 학제 간 융합 형태로 발전해 왔다. GeoCPS와 GeoAI 등 Geo-ICT가 ICT를 단순히 지질자원 분야에 적용하는 활용기술에 머물지 않고 하나의 융합 학문 분야로 발전을 위해서는 지구과학 및 자원공학의 이론과 기술, 즉 지질자원 분야의 학제를 유지시켜 온 기초 분야의 지속적인 발전이 함께 이루어져야만 가능하다.

Acknowledgements

본 연구는 한국지질자원연구원의 주요사업(GP2018-002)의 지원으로 수행되었으며, 이에 감사드립니다.

References

Accenture, 2019.08.07, https://www.accenture.com/us-en/insight- resources-digital-transformation-future-mining

ANSI/ISA-95.00.01, 2000. Enterprise-Control System Integration, Part 1: Models and Terminology.

ANSI/ISA-95.00.02, 2001. Enterprise-Control System Integration, Part 2: Object Model Attributes, contains additional details and examples to help explain and illustrate the Part 1 objects.

ANSI/ISA-95.00.03, 2005. Enterprise-Control System Integration, Part 3: Activity Models of Manufacturing Operations Management, presents models and terminology for defining the activities of manufacturing operations management.

ANSI/ISA-95.00.05, 2007. Enterprise-Control System Integration, Part 5: Business-to-Manufacturing Transactions, defines the transactions to interface business and manufacturing activities.

Bellman, R., 1978. An Introduction to Artificial Intelligence: Can Computers Think?, Boyd and Fraser Publishing Company, 146p.

Bello, J., Silva, C., Nov, O, Dubois, R., Arora, A., Salamon, J., Mydlarz, C., and Doraiswamy, H., 2019. SONYC: a system for monitoring, analyzing, and mitigating urban noise pollution. Communications of the ACM, 62(2), 68-77.

10.1145/3224204

Bergen, K., Johnson, P., Hoop, M., and Beroza, G., 2019. Machine learning for data-driven discovery in solid Earth geoscience. Science, 363(6433), eaau0323.

10.1126/science.aau032330898903

Bianco, M. and Gerstoft, P., 2017. Travel time tomography with adaptive dictionaries. IEEE Transactions on Computational Imaging, 4, 499-511.

10.1109/TCI.2018.2862644

Carneiro, C., Fraser, S., Crósta, A., Silva, A., and Barros, C., 2012. Semiautomated geologic mapping using self-organizing maps and airborne geophysics in the Brazilian Amazon. Geophysics, 77(4), K17-K24.

10.1190/geo2011-0302.1

Chua, L. and Yang, L., 1988. Cellular neural networks: theory, IEEE Transactions on Circuits and Systems, 35(10), 1273- 1290.

10.1109/31.7601

Cortes, C. and Vapnik, V., 1995. Support-vector networks. Machine Learning, 20(3), 273-297.

10.1007/BF00994018

Cracknell, M. and Reading, A., 2013. The upside of uncertainty: identification of lithology contact zones from airborne geophysics and satellite data using random forests and support vector machines. Geophysics, 78(3), WB113-WB126.

10.1190/geo2012-0411.1

Cracknell, M. and Reading, A., 2014. Geological mapping using remote sensing data: a comparison of five machine learning algorithms, their response to variations in the spatial distribution of training data and the use of explicit spatial information. Computers & Geosciences, 63, 22-33.

10.1016/j.cageo.2013.10.008

Derras, B., Bard, P., and Cotton, F., 2014. Towards fully data driven ground-motion prediction models for Europe. Bulletin of Earthquake Engineering, 12(1), 495-516.

10.1007/s10518-013-9481-0

DeVries, P., Thompson, T., and Meade, B., 2017. Enabling large-scale viscoelastic calculations via neural network acceleration. Geophysical Research Letters, 44(6), 2662-2669.

10.1002/2017GL072716

Dickens, J., Feineman, D., and Roberts, S., 2012. Choices, changes and challenges: lessons for the future development of the digital oilfield. Society of Petroleum Engineers. http://dx.doi.org/10.2118/150173-MS.

10.2118/150173-MS

Finazzi, F., 2016. The earthquake network project: Toward a crowdsourced smartphone‐based earthquake early warning system. Bulletin of the Seismological Society of America, 106(3), 1088-1099.

10.1785/0120150354

Finn, C., Goodfellow, I., and Levine, S., 2016. Unsupervised learning for physical interaction through video prediction, Proc. of the 30th International Conference on Neural Information Processing Systems, Barcelona, Spain, p.64-72.

Goodfellow, I., Bengio, Y., and Courville, A., 2016. Deep Learning, MIT Press, 800p.

Goodfellow, I., Pouget-Abadie, J., Mirza, M., Xu, B., Warde-Farley, D., Ozair, S., Courville A., and Bengio, Y., 2014. Generative adversarial networks, Proc. of the 27th International Conference on Neural Information Processing Systems, Montreal, Canada, p.2672-2680.

Heiskala, M., Jokinen, J., and Tinnilä, M., 2016. Crowdsensing-based transportation services - an analysis from business model and sustainability viewpoints. Research in Transportation Business & Management, 18, 38-48.

10.1016/j.rtbm.2016.03.006

Holtzman, B., Paté, A., Paisley, J., Waldhauser, F., and Repetto, D., 2018. Machine learning reveals cyclic changes in seismic source spectra in Geysers geothermal field. Science Advances, 4(5), eaao2929.

10.1126/sciadv.aao292929806015PMC5966224

Hulbert, C., Rouet-Leduc, B., Johnson, P., Ren, C., Riviere, J., Bolton, D., and Marone, C., 2019. Similarity of fast and slow earthquakes illuminated by machine learning. Natural Geoscience, 12, 69-74.

10.1038/s41561-018-0272-8

Hunter, T., Moldovan, T., Zaharia, M., Merzgui, S., Ma, J., Franklin, M., Abbeel, P., and Bayen, A., 2011. Scaling the mobile millennium system in the cloud, Proc. of the 2nd ACM Symposium on Cloud Computing, Cascais, Portugal

10.1145/2038916.2038944PMC4945188

Kang, J., Kim, I., Lee, S., Ryu, D., and Kwon, J., 2019. A deep CNN-based ground vibration monitoring scheme for MEMS sensed data. IEEE Geoscience and Remote Sensing Letters, 1-5. doi: 10.1109/LGRS.2019.2918641

10.1109/LGRS.2019.2918641

Karpatne, A., Atluri, G., Faghmous, J., Steinbach, M., Banerjee, A., Ganguly, A., Shekhar, S. Samatova, N., and Kumar, V., 2017. Theory-guided data science: a new paradigm for scientific discovery. IEEE Transactions on Knowledge and Data Engineering, 29(10), 2318-2331.

10.1109/TKDE.2017.2720168

Karpatne, A., Ebert-Uphoff, I., Ravela, S., Babaie, H., and Kumar, V., 2018. Machine learning for the geosciences: challenges and opportunities. IEEE Transactions on Knowledge and Data Engineering, 31(8), 1544-1554.

10.1109/TKDE.2018.2861006

Käufl, P., Valentine, A., and Trampert, J., 2016. Probabilistic point source inversion of strong-motion data in 3-D media using pattern recognition: a case study for the 2008 Mw 5.4 Chino Hills earthquake. Geophysical Research Letters, 43(16), 8492-8498.

10.1002/2016GL069887

Köhler, A., Ohrnberger, M., Riggelsen, C., and Scherbaum, F., 2008. Unsupervised feature selection for pattern search in seismic time series, Proc. of the 2008 International Conference on New Challenges for Feature Selection in Data Mining and Knowledge Discovery, 4, Antwerp, Belgium, 106-120.

Kohonen, T., 2013. Essentials of the self-organizing map. Neural Networks, 37, 52-65.

10.1016/j.neunet.2012.09.01823067803

Kong, Q., Allen, R., Schreier, L., and Kwon, Y., 2016. MyShake: a smartphone seismic network for earthquake early warning and beyond. Science Advances, 2(2), e1501055.

10.1126/sciadv.150105526933682PMC4758737

Krischer, L. and Fichtner, A., 2017. Generating seismograms with deep neural networks, Proc. of AGU Fall Meeting, S41D-03.

Kuhn, S., Cracknell, M., and Reading, A., 2018. Lithologic mapping using random forests applied to geophysical and remote-sensing data: a demonstration study from the Eastern Goldfields of Australia. Geophysics, 83(4), B183- B193.

10.1190/geo2017-0590.1

Kurzweil, R., 1990. The Age of Intelligent Machines, MIT Press Cambridge, 565p.

Lee, M., 2018. Digital Twrin and Smart Transform, KCERN the 51th Open Forum, Seoul, Korea, 242p.

Liu, Y., Mao X., He, Y., Liu, K., Gong, W., and Wang, J., 2013. CitySee: not only a wireless sensor network. IEEE Network, 27(5), 42-47.

10.1109/MNET.2013.6616114

Long, Y., She, X., and Mukhopadhyay, S., 2018. HybridNet: integrating model-based and data-driven learning to predict evolution of dynamical systems, Proc. of Conference on Robot Learning, Zürich, Switzerland.

Maslow, A., 1943. A theory of human motivation. Psychological Review, 50(4), 370-96.

10.1037/h0054346

Mathieu, M., Couprie, C., and LeCun, Y., 2016. Deep multi- scale video prediction beyond mean square error, Proc. of the 4th International Conference on Learning Representations, San Juan, Puerto Rico, 14p.

McCann, M., Jin, K., and Unser, M., 2017. Convolutional neural networks for inverse problems in imaging: a review. IEEE Signal Processing Magazine, 34(6), 85-95.

10.1109/MSP.2017.2739299

McGagh, J., 2014. Mine of the future, presented in the Internet of Things World Forum 2014, Cicago.

Ministry of Science and ICT, 2018. Artificial Intelligence (AI) R&D Strategy for I-Korea 4.0, 40p.

Minson, S., Brooks, B., Glennie, C., Murray, J., Langbein, J., Owen, S., Heaton, T., Iannucci, R., and Hauser, D., 2015. Crowdsourced earthquake early warning. Science Advances, 1(3), e1500036.

10.1126/sciadv.150003626601167PMC4640622

Mosser, L., Dubrule, O., and Blunt, M., 2017. Reconstruction of three-dimensional porous media using generative adversarial neural networks. Physical Review E, 96, 043309.

10.1103/PhysRevE.96.04330929347591

Mun, M., Reddy, S., Shilton, K., Yau, N., Burke, J., Estrin D., Hansen, M., Howard, E., West, R., and Boda, P., 2009. PEIR, the personal environmental impact report, as a platform for participatory sensing systems research, Proc. of the 7th international conference on Mobile systems, applications, and services, NY, USA, p.55-68.

10.1145/1555816.1555823

Ochoa, L., Niño, L., and Vargas, C., 2017. Fast magnitude determination using a single seismological station record implementing machine learning techniques. Geodesy and Geodynamics, 9(1), 34-41.

10.1016/j.geog.2017.03.010

Perol, T., Gharbi, M., and Denolle, M., 2018. Convolutional neural network for earthquake detection and location. Science Advances, 4(2), e1700578.

10.1126/sciadv.170057829487899PMC5817932

Poulton, M., 2002. Neural networks as an intelligence amplification tool: a review of applications. Geophysics, 67(3), 979-993.

10.1190/1.1484539

Ravela, S., 2012. Quantifying uncertainty for coherent structures. Procedia Computer Science, 9, 1187-1196.

10.1016/j.procs.2012.04.128

Ravela, S., 2015. Statistical inference for coherent fluids. Dynamic Data-Driven Environmental Systems Science, 121-133.

10.1007/978-3-319-25138-7_12

Reddy, R. and Nair, R., 2013. The efficacy of support vector machines (SVM) in robust determination of earthquake early warning magnitudes in central Japan. J. of Earth System Science, 122(5), 1423-1434.

10.1007/s12040-013-0346-3

Reichstein, M., Camps-Valls, G., Stevens, B., Jung, M., Denzler, J., Carvalhais N., and Prabhat, 2019. Deep learning and process understanding for data-driven Earth system science. Nature, 566, 195-204.

10.1038/s41586-019-0912-130760912

Robinson, B., Power, R., and Cameron, M., 2013. A sensitive Twitter earthquake detector, Proc. of the 22nd International Conference on World Wide Web, p.999-1002.

10.1145/2487788.2488101

Roden, R., Smith, T., and Sacrey, D., 2015. Geologic pattern recognition from seismic attributes: principal component analysis and self-organizing maps. Interpretation, 3(4), SAE59-SAE83.

10.1190/INT-2015-0037.1

Rouet-Leduc, B., Hulbert, C., Bolton, D., Ren, C., Riviere, J., Marone, C., Guyer, R., and Johnson, P., 2018. Estimating fault friction from seismic signals in the laboratory. Geophysical Research Letters, 45(3), 1321-1329.

10.1002/2017GL076708

Rouet-Leduc, B., Hulbert, C., and Johnson, P., 2019. Continuous chatter of the Cascadia subduction zone revealed by machine learning. Natural Geoscience, 12, 75-79.

10.1038/s41561-018-0274-6

Rouet-Leduc, B., Hulbert, C., Lubbers, N., Barros, K., Humphreys, C., and Johnson, P., 2017. Machine learning predicts laboratory earthquakes. Geophysical Research Letters, 44(18), 9276-9282.

10.1002/2017GL074677

Sadowski, P., Fooshee, D., Subrahmanya, N., and Baldi, P., 2016. Synergies between quantum mechanics and machine learning in reaction prediction. J. Chemical Information and Modeling, 56(11), 2125-2128.

10.1021/acs.jcim.6b0035127749058

Saputelli, L. A., Bravo C., Moricca, G., Cramer R., Nikolaou, M., Lopez, C., and Mochizuki S., 2013. Best practices and lessons learned after 10 years of digital oilfield (DOF) implementations, SPE 167269, SPE Kuwait Oil and Gas Show and Conference, Kuwait City, Kuwait, 19p.

10.2118/167269-MS

Schwab, K., 2016. https://www.weforum.org/about/the-fourth- industrial-revolution-by-klaus-schwab

Shoji, D., Noguchi, R., Otsuki, S., and Hino, H., 2018. Classification of volcanic ash particles using a convolutional neural network and probability. Scientific Reports, 8, 8111.

10.1038/s41598-018-26200-229802305PMC5970178

Srivastava, N., Mansimov, E., and Salakhudinov, R., 2015. Unsupervised learning of video representations using LSTMs, Proc. of the 32nd International Conference on Machine Learning, Lille, France, p.843-852.

Thiagarajan, A., Ravindranath, L., LaCurts, K., Toledo, S., and Eriksson, J., 2009. VTrack: accurate, energy-aware road traffic delay estimation using mobile phones, Proc. of the 7th ACM Conference on Embedded Networked Sensor Systems, Berkeley, California, p.85-98.

10.1145/1644038.1644048

Trugman, D. and Shearer, P., 2018. Strong correlation between stress drop and peak ground acceleration for recent M 1-4 earthquakes in the San Francisco bay area. Bulletin of the Seismological Society of America, 108(2), 929-945.

10.1785/0120170245

Valentine, A. and Trampert, J., 2012. Data space reduction, quality assessment and searching of seismograms: autoencoder networks for waveform data. Geophysical Journal International, 189(2), 1183-1202.

10.1111/j.1365-246X.2012.05429.x

Valera, M., Guo, Z., Kelly, P., Matz, S., Cantu, V., Percus, A., Hyman, J., Srinivasan, G., and Viswanathan, H., 2018. Machine learning for graph-based representations of three dimensional discrete fracture networks. Computational Geosciences, 22(3), 695-710.

10.1007/s10596-018-9720-1

Van der Baan, M. and Jutten, C., 2000. Neural networks in geophysical applications. Geophysics, 65(4), 1032-1047.

10.1190/1.1444797

Winston, P., 1992. Artificial Intelligence, Pearson, 737p.

Wu, X. and Hale, D., 2016. 3D seismic image processing for faults. Geophysics, 81(2), IM1-IM11.

10.1190/geo2015-0380.1

Wunsch, C., 2006. Discrete Inverse and State Estimation Problems: With Geophysical Fluid Applications, Cambridge University Press, 384p.

10.1017/CBO9780511535949

Xingjian, S., Chen, Z., Wang, H., Yeung, D., Wong, W., and Woo, W., 2015. Convolutional LSTM network: a machine learning approach for precipitation nowcasting, Proc. of the 28th International Conference on Neural Information Processing Systems, Montreal Canada, p.802-810.

Yin, J., Karimi, S., Robinson, B., and Cameron, M., 2012. ESA: emergency situation awareness via microbloggers, Proc. of the 21st ACM International Conference on Information and Knowledge Management, Maui, Hawaii, USA, p.2701-2703.

10.1145/2396761.2398732

(사)창조경제연구회, Korea Creative Economy Research Network

International Society of Automation

하드 데이터(hard data)와 대비되는 개념으로, 측정하기 어려운 대상에 대한 정보를 담은 데이터를 소프트 데이터(soft data)라고 하며, 일반적으로 역산모델링 결과나 인간의 판단이나 평가에 의해 제공되는 데이터가 이에 해당한다. 하드 데이터에 비해 불확실성이 매우 크며, 불확실성에 대한 중요한 정보를 제공하는 관측값을 의미할 때도 있다.

Journal of the Korean Society of Mineral and Energy Resources Engineers ISSN:2288-0291(Print) 2288-2790(Online) 한국자원공학회지

Preview

New Opportunities and Challenges of Geo-ICT Convergence Technology: GeoCPS and GeoAI

ABSTRACT

MAIN

Fig. 1.

Fig. 2.

Fig. 3.

Fig. 4.

Fig. 5.

Fig. 6.

Fig. 7.

Fig. 8.

Acknowledgements

References