서 론
연구방법
불확실성 정량화 (P90-P50-P10)
랜덤 포레스트(Random Forest, RF)
적합 분위수 회귀(Conformalized Quantile Regression, CQR)
연구내용
대상 광구
데이터 전처리
RF 기반 분위수 회귀 모델 구성
연구결과
Case 1: QRF 분위수 예측 결과
Case 2: 수정된 CQR 분위수 예측 결과
결 론
서 론
셰일가스 및 셰일오일은 10여 년간 전 세계 에너지 공급에서 필수적인 부분으로 성장해 왔다. 특히, 북미의 셰일가스는 유럽 및 동아시아의 주요 에너지원이 되고 있으며, 청정에너지 시대로 전환하기 위한 브릿지 에너지로서 그 중요성이 더욱 부각되고 있다(GIS, 2025).
셰일 저류층과 같이 비전통 저류층(unconventional play) 개발은 저류층의 특성 파악이 어려워 본질적으로 사업적 리스크를 수반하며, 개발 프로젝트의 성패는 궁극 가채량(Estimated Ultimate Recovery, EUR)의 예측 정확도에 크게 좌우된다(Liang and Zhao, 2019). 셰일 저류층은 지질학적 불균질성과 수압파쇄에 따른 복잡한 유동 거동 때문에 미래 생산량을 예측하기 어려우며, 따라서 EUR 추정에도 상당한 불확실성이 수반된다(Can and Kabir, 2012). 실제로 전통적인 결정론적 방법만으로는 이러한 불확실성을 적절히 포착하기 어려워 예측 신뢰구간이 목표 신뢰수준을 벗어나거나 예측 시간이 많이 소요되는 문제가 보고된 바 있다(Joshi, 2018). Cipolla et al.(2010)도 전통적인 생산 분석 기법을 비전통 저류층에 적용할 때 발생할 수 있는 문제들을 지적하였다.
결정론적 방법이 가지는 불확실성 평가에 대한 한계를 극복하고자 확률론적 기법을 활용한 EUR 예측이 시도되었다. Arps 또는 SEPD(Stretched Exponential Production Decline) 등 다양한 생산감퇴곡선 모형에 몬테카를로 시뮬레이션(Monte Carlo simulation)을 결합함으로써 셰일 저류층의 확률적 생산량 예측 방법 등이 제시되었다(Can and Kabir, 2012; Cheng et al., 2005; Kim et al., 2014; Yehia et al., 2023). 또한, Duong(2011)이 제안한 감퇴곡선 모델과 지구통계학을 결합하여 미시추지역의 생산량 예측 불확실성을 분석한 연구도 제시되었다(Xi and Morgan, 2019). 그러나 생산감퇴곡선 모델은 준정상상태(semi-steady state) 유동상태 하에서 생산 데이터가 충분히 확보되어야 신뢰할 수 있는 예측이 가능하다는 한계가 있다.
셰일 저류층의 개발이 확대되어 현장에서 획득되는 생산자료의 규모가 증가하면서 빅데이터를 활용한 데이터 기반 머신러닝 기법이 도입되었다. 인공신경망(artificial neural network), 서포트 벡터머신(support vector machine), 랜덤 포레스트(Random Forest, RF) 등의 다양한 머신러닝 기법이 EUR 예측, 저류층 특성변수 예측, 암상분류, 물리검층 해석, 물리검층 자료 복원, 저류층 히스토리 매칭, 생산압력 복원 등 유가스개발 분야의 다양한 영역에서 활용되고 있다(Ahn et al., 2018; Alizadeh et al., 2012; Ibrahim, et al., 2023; Iturrar and Parra, 2014; Ki et al., 2020; Kim et al., 2020; Oh et al., 2021; Silversides et al., 2015; Zhou et al., 2024).
머신러닝 기법 중 하나인 RF는 Breiman(2001)이 제안한 방법으로, 배깅(bagging, bootstrap aggregating)과 무작위 변수 선택을 통해 다수의 결정트리 모델을 구성하여 높은 예측 정확도를 달성하는 기법이다. RF는 개별 결정트리에서 도출된 예측값들의 평균값을 제공하여 회귀 문제에서 높은 정확도의 결과를 제공하면서도 과적합에 강하고 잡음에 안정적인 특성을 보인다. 또한, RF 모델은 결정트리의 특성상 입력 변수의 정규화(normalization)가 필요 없으며, 학습 과정에서 내부적으로 변수 중요도를 평가할 수 있어 복잡한 다변수 문제에서 우수한 성능을 보인다. 실제 셰일 저류층의 현장 데이터에 RF를 적용한 연구에서는 전통적 선형회귀보다 높은 EUR 예측 성능과 신뢰도를 얻었으며, 주요 영향 변수를 식별하여 현장 분석에 기여하였다(Liang and Zhao, 2019).
분위수 회귀(quantile regression)는 평균이 아닌 조건부 분포의 특정 분위수를 직접 추정함으로써 예측 분포의 다양한 특성을 파악하는 통계 기법이다. 이를 RF에 접목한 것이 Meinshausen(2006)에 의해 제안된 분위수 회귀 포레스트(Quantile Regression Forest, QRF) 기법이다. QRF를 통해 응답 변수(response variable)의 전체 조건부 분포에 대한 정보를 비모수적(non-parametric)으로 얻을 수 있다. 특히 QRF는 고차원의 예측 변수 공간에서도 안정적으로 조건부 분위수를 추정하여 P10, P50, P90 등의 특정 분위수를 계산할 수 있다. 이러한 분위수 예측을 활용하면 각 생산정의 EUR에 대한 예측구간(prediction interval)을 구성할 수 있어 불확실성을 정량화할 수 있다.
그러나 이러한 예측구간의 신뢰성을 평가하기 위해 예측구간 포함률(Prediction Interval Coverage Probability, PICP) 검증이 필수적이다. PICP는 모델이 제시한 예측구간(예: P90−P10 범위)이 실제 관측값을 포함하는 비율을 나타내는 지표로서, 이론상 P90−P10 구간은 80%의 신뢰구간이므로 PICP = 80%가 되어야 한다. 이처럼 이론적 신뢰수준과 실제 포함 확률이 일치하는지 확인해야, 모델이 산출한 분위수 예측값을 올바르게 해석할 수 있다. 만약 PICP가 목표 수준과 불일치한다면, 예측구간의 폭이 너무 좁거나 넓어 실제로 믿을 수 없는 정보가 될 수 있다. 특히 셰일 자원 개발에서는 투자 규모와 생산량 예측의 불확실성을 정량화하는 데 이 구간들이 활용되므로, PICP 검증을 통해 예측구간의 적합성을 확인하는 것이 사업 리스크 관리 및 의사결정의 신뢰성을 높이는 데 중요하다.
기존 연구 및 사례를 통해, 분위수 예측구간이 이론상의 신뢰수준과 일치하지 않고 과대 혹은 과소로 포함하는 문제가 있음을 확인하였다(Molinder et al., 2021; Yin, et al., 2023; Zhang et al., 2023). 이러한 문제를 해결하기 위해 QRF 예측구간에 대한 PICP 정확도를 실제 데이터로 검증하고, 이론적 신뢰수준과 맞지 않는 경우 예측구간을 보정하는 방법으로 적합 분위수 회귀(Conformalized Quantile Regression, CQR) 기법이 제시되었다(Romano et al., 2019; Wang et al., 2022). CQR은 대칭적 예측구간 보정기법인 적합예측(conformal prediction)을 분위수 회귀 모델에 적용하는 방법으로서, 예측구간의 유효 커버리지를 보장하도록 설계되어 모델 예측구간의 신뢰도를 향상시킬 수 있다.
이 연구에서는 북미 Eagle Ford Shale 지역의 셰일 오일 생산정을 대상으로, RF 기반 분위수 회귀 모델을 활용하여 EUR의 예측 불확실성을 P90, P50, P10 지표로 정량화하고, 해당 예측구간이 이론적으로 설정된 신뢰수준인 PICP과 통계적으로 일치하는지를 분석하였다. 또한, 셰일 저류층에 대해 수정된 CQR 기법을 적용하여 목표 신뢰수준을 만족시키는 정규화 절차를 수행하였다. 이를 통해 수정된 예측모델의 신뢰도 및 불확실성 표현의 적정성을 체계적으로 검토하였다.
연구방법
불확실성 정량화 (P90-P50-P10)
오일 및 가스 개발분야에서 P90, P50, P10은 매장량(reserves) 또는 EUR의 불확실성 평가와 관련된 핵심적인 개념이다. 즉, 이는 모두 확률적 분위값(probablistic quantiles)으로서 자원의 양에 대한 신뢰수준(confidence level)을 기반으로 하는 수치이다.
• P90: 매장량 또는 EUR의 실제값이 이 기준을 초과할 확률이 90%임을 의미하며, 가장 보수적인 추정치로 최소 확보가능성에 대한 평가에 사용된다.
• P50: 매장량 또는 EUR의 실제값이 이 기준을 초과할 확률이 50%로, 예측 분포의 중앙값(median)에 해당한다. 평균적인 개발 성과를 가정할 때의 기대치이다.
• P10: 매장량 또는 EUR의 실제값이 이 기준을 초과할 확률이 10%로, 가장 낙관적인 시나리오를 나타내며 업사이드 포텐셜을 평가할 때 활용된다.
Fig. 1은 이러한 P90, P50, P10의 개념을 확률 분포 기반으로 시각화한 예이다. Fig. 1(a)는 EUR의 히스토그램 형태의 확률분포를, Fig. 1(b)는 해당 분포의 누적분포함수(Cumulative Distribution Function, CDF)의 보완값(1−CDF)을 나타낸다. Fig. 1(b)에서 P90, P50, P10은 수직선과 수평선을 통해 시각적으로 구분되어 있으며, 각각의 지점에서 EUR 값이 해당 분위값 이상일 확률이 90%, 50%, 10%임을 의미한다. 따라서, P90−P50−P10은 불확실성이 항상 존재하는 유가스전에서 개발 의사결정 및 경제성 평가에 있어서 기술적 리스크와 재무 리스크를 동시에 고려하는 데 필수적인 지표로 활용된다.
랜덤 포레스트(Random Forest, RF)
트리 기반 학습모델은 구조가 직관적이고 해석 가능성이 높으며, 다양한 문제 유형에 유연하게 적용 가능하다는 점에서 지도학습 알고리즘 중에서도 널리 사용되는 범주에 속한다. 특히 분류와 회귀 문제 모두에 적합하며, 데이터의 분포가 선형이든 비선형이든 관계없이 효과적으로 작동하는 유연성을 가진다(Yoon et al., 2018).
그 중에서도 RF는 대표적인 트리 기반 앙상블 학습(ensemble learning) 기법이다. RF는 Fig. 2와 같이 개별적으로 학습된 다수의 결정트리(decision tree)를 결합하여 최종 예측값을 산출하는 구조로, Breiman(2001)이 제안한 이래로 많은 분야에서 성능과 안정성을 인정받아 왔다.
RF의 핵심 개념은 다음 두 가지 아이디어를 결합한 것이다.
배깅
원본 학습 데이터에서 중복을 허용하여 여러 개의 부트스트랩 샘플을 생성하고, 각 샘플에 대해 개별 결정트리를 훈련시킨다. 이로 인해 각 트리는 서로 다른 데이터에 기반하여 학습되므로, 모델 간 상관관계가 감소한다. 최종 예측은 회귀의 경우 평균값, 분류의 경우 다수결 방식으로 집계된다.
무작위 특성 선택
각 노드 분할 시 전체 특성 중 일부만 무작위로 선택하여 후보 분할 기준을 설정한다. 이는 모델의 다양성을 증가시키고, 과적합을 방지하는 데 기여한다.
이와 같이 데이터의 다중 샘플링과 특성의 무작위 선택을 통해 생성된 비상관화된 수백 개의 결정트리들이 하나의 앙상블을 이루며, 이는 단일 트리에 비해 예측의 분산을 감소시키고 정확도를 높이는 효과를 가진다. 또한 트리 기반 모델은 데이터의 스케일이나 분포의 정규성(normality) 등에 민감하지 않기 때문에, 입력 변수의 전처리 비용이 낮고 직관적인 모델링이 가능하다는 실용적인 장점도 존재한다.
결정트리는 아래와 같은 분할 기준 함수인 식 (1)을 반복적으로 최소화함으로써 구성된다.
여기서, 는 번째 트리의 목적함수이며, 은 데이터의 개수, 첨자 left와 right는 각각 왼쪽과 오른쪽 하위노드를 의미한다. 그리고 는 하위노드에 포함된 번째 샘플의 출력 변수에 대한 참값이며, 은 하위노드에 포함되는 데이터의 평균을 의미한다.
RF 모델은 다수의 결정트리로 구성된 앙상블 모델로, 각 트리는 입력 데이터에 대해 서로 다른 예측값을 산출한다. 이러한 트리들의 예측값은 단일 수치 예측이 아닌 확률적 분포로 해석할 수 있으며, 이 예측 분포는 다양한 예측 가능성을 반영하는 샘플 집합으로 간주할 수 있다. 전체 RF 모델의 예측 분포는 식 (2)와 같은 앙상블 집합인 로 표현된다.
여기서 는 번째 트리의 예측값, 는 전체 트리 개수이다. 그리고 는 모든 트리의 예측 결과로 구성된 집합으로서, RF의 예측 분포를 의미한다. 이 분포는 단순히 평균 예측값을 산출하는 데 그치지 않고, RF를 분위수 예측 모델인 QRF로 전환하여 예측 불확실성을 정량화하는 데 매우 유용하다. 특정 분위수를 기준으로 상·하단 경계를 설정하면, 예측값이 포함될 것으로 기대되는 확률 구간(confidence interval)을 정의할 수 있다. 예를 들어, RF 예측 분포의 상위로부터 90%와 10%에 해당하는 분위값을 각각 P90, P10이라 할 때, 이들로 구성된 신뢰구간은 식 (3)과 같이 정의된다.
여기서, 은 P90와 P10 사이의 신뢰구간을 의미한다. 는 예측분포의 상위 90%, 즉 하위 10%에 해당하는 값으로 P90이며, 는 상위 10%에 해당하는 값으로 P10을 나타낸다. 따라서 은 전체 예측 분포에서 약 80%의 확률로 실제값이 존재할 것으로 기대되는 구간을 나타낸다. 이러한 신뢰구간은 비모수적 방식으로 정의되며, 모델 예측의 신뢰성과 불확실성을 동시에 평가하는 도구로 활용된다. 실제값이 이 신뢰구간 내에 존재하는 비율은 PICP로 정의되며, 식 (4)와 같은 수식으로 계산된다.
여기서, 는 번째 데이터의 실제값이며, 은 사용한 총 데이터의 수이다. 는 번째 데이터에 대해 RF 모델로부터 도출한 [P90, P10] 구간을 나타낸다. 그리고 는 번째 데이터의 실제값 가 에 포함되면 1, 그렇지 않으면 0의 값을 반환하는 지시함수(indicator function)이다. 즉, 실제값 가 예측 구간 안에 존재하는지를 계산하며, 이를 전체 샘플에 대해 평균 낸 값이 PICP가 된다. 일반적으로, 이 값이 80%이면 모델의 예측 불확실성이 신뢰할 만한 수준으로 평가된다.
적합 분위수 회귀(Conformalized Quantile Regression, CQR)
셰일가스 생산정의 정적자료와 동적자료를 활용하여 QRF 모델을 학습시켜 개별 생산정의 EUR을 예측할 때, EUR의 불확실성을 P90−P50−P10으로 정량화할 수 있다. 여기서, 이론적으로는 개별 생산정의 EUR 실제값이 에 속할 확률인 PICP = 80%을 만족해야 한다. 즉, 통계적으로 전체 생산정 중 80%의 생산정에서 해당 EUR은 에 포함되고, 10%는 P90보다 작은 값으로, 나머지 10%는 P10보다 큰 값으로 나오는 것을 의미한다. 그러나 셰일가스의 생산정 자료를 QRF에 적용하여 평가한 PICP는 80%와 다른 결과를 나타낼 수 있다. 이러한 경우, QRF를 구성하는 결정트리의 분위수인 , , 으로부터 유가스 분야에서 사용하는 P90, P50, P10을 직접적으로 매핑할 수 없다는 것을 의미하며, 이를 해결하기 위해 CQR 적용이 필요하다.
Romano et al.(2019)이 제안한 CQR은 다음과 같다. Fig. 3은 EUR의 1−CDF 그림이다. 의 PICP가 80%보다 크게 나타나는 경우 PICP = 80%가 되도록 Fig. 3과 같이 EUR의 양쪽 경계값을 𝛾만큼 조정하여 P90*와 P10* 값을 선정하는 기법이다. 즉, P90와 P10의 값을 동일 크기만큼 변경시켜 예측구간의 길이를 줄어거나 늘리는 방법으로 PICP를 이론상 수준으로 유지하는 것이다.
그러나 Fig. 3과 같이 예측구간이 새로운 P90*와 P10*으로 설정되는 경우, P90*에 해당하는 분위는 70%이고, P10*의 분위는 약 13%에 해당한다. 실제 데이터를 이에 적용할 경우, P90*보다 작은 영역과 P10*보다 큰 영역에 놓일 수 있는 데이터의 개수가 같지 않아 P90와 P10의 정의에 위배될 가능성이 발생한다.
위의 문제를 해결하기 위해 이 연구에서는 Fig. 4와 같이 P90, P10을 직접 변경하는 대신, 90%, 10%의 분위에 동일 크기만큼 변경시킨 후 P90*, P10*을 구하는 것이다. Fig. 4는 이와 같은 보정이 반영된 P90*, P50*, P10*의 개념을 모식도로 표현한 것으로, 원래의 예측 분위값 대비 보정된 위치를 시각적으로 표시하였다.
PICP = 80%를 만족시키는 보정된 예측 구간인 과 P90*, P10*을 식 (5), (6), (7)과 같이 정의하고, 보정계수 𝛼를 두어 분위수 경계를 확장하거나 축소한다. 그리고 를 사용한 PICP*를 식 (8)과 같이 정의한다.
여기서, 𝛼는 P90−P10 구간을 변경하기 위한 보정 계수이며, P90*, P10*은 보정된 분위값을 나타낸다. 이렇게 하면 P90*보다 작은 영역과 P10*보다 큰 영역의 크기가 동일하여 실제 데이터가 각 영역에 속할 확률이 같아진다.
또한, 예측 구간의 중심값인 P50 역시 실제 생산정의 분포를 보다 정확히 반영할 수 있도록 보정할 수 있다. 즉, 예측된 P50 값에서 좌우 대칭이 아닌 실제 생산정의 편차를 반영한 보정 중심값 P50*을 식 (9)와 같이 정의한다.
여기서, 𝛽는 실제값 기준으로 P50 위치를 좌우로 이동시켜, 중심값의 편향을 교정하는 계수이다. 이를 통해 예측 분포의 중심이 실제값과 정렬되도록 조정할 수 있다.
연구내용
대상 광구
Eagle Ford Shale은 텍사스 남부의 오스틴 초크(Austin Chalk) 아래, 부다 석회암(Buda Limestone) 위에 위치하며, 두께는 50~400피트(최대 1,000피트)에 이른다(Smith et al., 2013). Fig. 5는 Eagle Ford Shale의 시추정 위치와 지질학적 특성을 표시한 것이다. Fig. 5(a)는 천연가스(적색) 및 오일(녹색) 생산분포를 나타낸 것으로, Eagle Ford Shale의 남쪽에서는 천연가스가 생산되며, 북쪽으로는 오일이 주로 생산되고 있다. Fig. 5(b)는 층서구조를 나타낸 것이다. Eagle Ford Shale은 해수면 아래 4,000~14,000피트의 심도에 분포하며, 심도에 따라 생성되는 탄화수소의 상태가 달라진다(Hammes et al., 2011). 4,000피트 이하에서는 오일이, 더 깊은 곳에서는 주로 천연가스가 생성된다. 높은 탄산염 함량(최대 70%)으로 인해 취성(brittleness)이 강하게 나타나며, 이는 수압파쇄에 매우 유리한 조건이다(Sone and Zoback, 2013).

Fig. 5.
Eagle Ford Shale (a) location; (b) southwest-northeast cross-section of the Eagle Ford formation (Art Berman, 2025; Hentz and Ruppel, 2010).
Eagle Ford Shale은 2008년 개발이 시작되었으며, 2023년 기준 28,920개의 시추정이 있다. 2023년 Eagle Ford Shale의 원유 생산량은 하루 약 110만 배럴(1.1 MMstb/d)을 기록했다. Eagle Ford는 미국 전체 셰일 오일 생산량의 약 8.8%를 차지하며, Permian, Bakken에 이어 세 번째로 큰 셰일 오일 생산지이다. 천연가스 생산도 꾸준히 증가하여 2024년 기준 하루 68~71억 입방피트(6.8~7.1 Bscf/d)에 달한다(Energies Media, 2025).
데이터 전처리
이 연구에서는 Eagle Ford Shale에서 취득한 생산정 중 오일생산정을 주 대상으로 하였으며, 아래의 전처리 조건을 적용하여 머신러닝 예측 모델에 필요한 자료를 선별하였다.
1. 60개월(5년) 이상의 오일 생산 이력이 있는 수평 생산정
2. 생산 시작 후 초기 피크생산 이전의 월별 생산자료 제외
3. 피크생산 이후 단일 감퇴 경향을 보이는 생산정
이와 같은 기준을 통해 최종적으로 총 10,395개 생산정이 선별되었다. 입력 변수는 정적 변수(static feature)와 동적 변수(dynamic feature)로 구분되며, 세부 구성은 Table 1에 요약되어 있다. 또한 주요 변수의 분포 특성은 Fig. 6에 히스토그램 형태로 제시하였다. 정적 입력 변수는 생산정의 위치, 프로판트 및 파쇄 유체량과 같은 수압파쇄 관련 완결 데이터를 포함한다. 동적 입력 변수는 생산량 시계열 데이터로서, 피크 생산 이후 최대 24개월 동안의 월별 오일 생산량으로 구성된다. 이때, 생산량 시계열의 길이는 최소 1에서 최대 24까지 길이가 다른 24가지의 경우를 고려한다.
Table 1.
Available dataset for machine learning
| Data type | Feature | Comments |
| Input data | Longitude (°)1) | Static feature |
| Latitude (°)1) | ||
| True vertical depth, TVD (ft) | ||
| Fracturing water intensity (gal/ft) | ||
| Proppant intensity (lbs/ft) | ||
| Production rate (1–24 months) (stb/m) | Dynamic feature | |
| Target data | Normalized 60-month cumulative production (stb/ft) | EUR |
타깃 변수로서 피크 생산 이후 60개월 동안의 누적 오일 생산량을 천공 길이(perforation interval)로 나눈 값을 예측 대상으로 정의하였다. 이는 단위 천공 길이당 누적 생산량을 의미하며, 분석의 편의를 위해 해당 값을 EUR로 가정하였다.
RF 기반 분위수 회귀 모델 구성
RF 기반 분위수 회귀 모델을 구성하고 Eagle Ford Shale 생산정의 EUR 예측과 그에 대한 불확실성 평가를 수행하였다. 이를 위해 Table 2와 Table 3에 요약된 바와 같이, 두 모델(Case 1, Case 2)을 적용하였다.
Table 2.
Uncertainty estimation cases for EUR
| Uncertainties | Remark | |
| Case 1 | P90, P10 | QRF model |
| Case 2 | P90*, P10* | Modified CQR model |
Table 3.
Data split scheme for Cases 1 and 2
| Data split ratio | |
| Case 1 | Training data: Test data = 8:2 |
| Case 2 | Training data: Calibration data1): Test data = 7:1.5:1.5 |
Case 1은 QRF 회귀 모델로부터 도출된 90% 및 10% 분위수 예측값을 활용하여 신뢰구간을 구성하고, 이를 기반으로 EUR 예측 불확실성을 분석한다. 즉, 식 (3)에서 정의된 방식으로 각 생산정에 대한 P90, P10의 신뢰구간을 산정하며, 별도의 보정 계수 없이 QRF 모델이 산출한 기본 분위수 예측값을 그대로 사용한다. 데이터 분할은 전체 데이터를 학습:시험 = 8:2로 설정하였으며, 모델의 불확실성 및 안정성을 검토하기 위해 무작위 분할을 기반으로 50회 반복 실험을 수행하였다.
Case 2는 수정된 적합 분위수 회귀인 CQR을 구성하고 예측된 신뢰구간에 대해 보정 계수를 적용하였다. 즉, 모델의 신뢰도 지표인 PICP*가 사전 정의된 기준값(80%)이 되도록 조정하는 방식이다. 식 (5), (6), (7), (8)에 정의된 보정계수 𝛼를 조절하여 PICP* = 80%를 충족하는 를 결정한 후, EUR 예측 불확실성을 분석한다. 이 보정을 통해 신뢰구간을 적절히 제어하고 예측 신뢰성을 향상시키고자 하였다. 이를 위해 전체 데이터를 학습(training), 보정(calibration), 시험(test) 세트로 분할하였으며, 그 비율은 각각 7:1.5:1.5로 구성하였다. 보정 데이터는 학습된 분위수 모델의 P90 및 P10을 대상으로 𝛼를 최적화하여, PICP* = 80% 조건을 만족하는 신뢰구간을 도출하는 데 사용된다. 또한, 보정 데이터는 P50*을 찾기위해 𝛽를 최적화하는 것에도 사용된다. 보정이 완료된 후, 별도로 확보된 시험 데이터를 이용하여 보정된 모델의 예측 신뢰성과 신뢰구간 폭을 평가하였다. Case 2 또한 50회 반복 실험을 통해 통계적 평가를 수행하였으며, 수행 과정은 Fig. 7의 흐름도로 요약된다.
Case 1 및 2 모두 동일한 모델 구조를 사용하였다. 즉, 각 모델은 500개의 결정트리로 구성되어 있으며, 정적 입력 변수(생산정 위치, 수압파쇄 정보 등)와 함께 동적 생산량 변수를 조합하여 입력 변수를 구성하였다. 동적 변수는 생산 시작 후 1개월에서 24개월까지의 월별 오일 생산량을 포함하며, 생산개월 수에 따라 총 24개의 입력 조합이 생성된다. 따라서, 이 연구에서는 1개월부터 24개월까지 생산 시계열 데이터 길이에 따라 총 24개의 분위수 모델을 독립적으로 학습시켰으며, 각 모델에 대해 EUR 예측과 불확실성 지표를 분석하였다. 이와 같은 구성은 초기 생산 데이터의 누적 길이에 따라 예측 성능 및 신뢰도 변화 양상을 종합적으로 비교·분석하는 데 목적이 있다.
연구결과
Case 1: QRF 분위수 예측 결과
Table 2와 Table 3에서 정의된 Case 1에 대해 QRF 모델을 학습시키고 시험 데이터에 대한 EUR 예측 및 불확실성 평가를 50회 반복 수행하였다. 불확실성 평가는 식 (3)에서 정의된 P90 및 P10 분위수를 기반으로 수행되었으며, 각 반복 실험에서 시험 데이터의 PICP를 계산하였다. Fig. 8은 학습된 QRF 모델이 시험 데이터에 대해 EUR 예측값과 실제값을 비교한 결과이다. Fig. 8(a)−(d)는 각각 1개월, 6개월, 12개월, 24개월의 월별 생산 데이터를 입력 변수로 사용한 경우로, 생산 데이터 기간이 길어질수록 예측 정확도는 0.8024에서 0.9822로 향상됨을 보여준다.
Fig. 9는 입력 변수로 사용한 월별 생산 데이터 수에 따른 시험 데이터의 PICP를 상자그림(boxplot) 형태로 나타낸 것이다. 모든 경우에 대해 PICP는 기준이 되는 80%를 초과하였으며, 특히 8개월 이상 입력 시 증가 경향이 뚜렷하며 최대 96%에 이르는 것으로 확인되었다. 이는 구간이 이론적인 80%보다 과도하게 넓게 형성되었음을 의미한다. 즉, 분위수 기반 예측만으로는 정확한 불확실성 표현이 어려울 수 있음을 시사한다.
Table 4에 제시된 시험데이터 내 특정 생산정에 대해 QRF를 사용하여 EUR 예측 및 불확실성을 분석하였으며, 그 결과를 Fig. 10에 제시하였다. Fig. 10(a)는 QRF 입력 변수로 사용된 월별 생산량 데이터의 길이에 따라 예측된 P90, P50, P10 값의 변동 추이를 나타낸 것이고, Fig. 10(b)는 P10−P90 간격, 즉 예측 신뢰구간 길이의 변화를 나타낸 그래프이다. 초기에는 입력 데이터 증가에 따라 구간 폭이 급격히 줄어들지만, 15개월 이후(Fig. 10의 영역 A에 해당)부터는 구간 축소가 거의 발생하지 않으며 일정 수준에서 유지되는 현상이 관찰된다. 이러한 결과는 Fig. 9에서 확인된 PICP의 경향과 함께 해석할 수 있다. 입력 데이터 길이가 증가하면 구간이 적절히 줄어들지 않는 대신 PICP의 값이 90%를 넘어 95% 이상으로 증가하는 경향을 보인다. 즉, P90 및 P10으로 구성된 로는 EUR 예측의 불확실성에 대한 타당하고 적절한 추정이 어렵다는 것이다. 이와 반대로, PICP를 80%로 유지하도록 하면 Fig. 10(b)의 과도한 신뢰구간을 줄여 불확실성에 대한 적정 평가가 가능하다는 것을 의미한다.
Table 4.
An example well in test data
Case 2: 수정된 CQR 분위수 예측 결과
Case 2에서는 PICP = 80%를 유지하기 위해 Table 2 및 Table 3의 조건에 따라 수정된 CQR 모델을 구축하였다. 우선 학습 데이터를 이용하여 QRF 회귀 모델을 학습시킨 뒤, 보정 데이터를 활용하여 PICP* = 80%가 되도록 𝛼를 결정하였다. Fig. 11은 Fig. 7에 제시된 흐름도에서 ITR = 50으로 적용하여 도출된 PICP*와 𝛼를 분석한 결과이다. Fig. 11(a)는 보정 데이터에 대해 반복된 실험에서 PICP*가 안정적으로 80% 수준에 수렴하는 것을 보여주며, CQR 모델이 목표 신뢰수준을 달성했음을 나타낸다. Fig. 11(b)는 각 생산개월 수 (1~24개월)에 대해 계산된 𝛼 값의 분포를 상자그림으로 시각화한 것이다. 분석결과, 8개월 이상의 월별 생산자료를 사용할 경우 𝛼는 지속 증가하는 경향을 보였다. 24개월 생산 데이터를 사용한 경우 𝛼값이 평균 13.5까지 도달하여 신뢰구간은 로 크게 좁혀지는 것을 알 수 있다. 즉, P90*와 P10* 사이의 신뢰구간이 좁혀짐을 의미한다.
보정 데이터를 통해 보정이 완료된 CQR 모델을 새로운 시험 데이터에 적용하여 예측 신뢰구간의 성능을 검증하였다. 이 과정에서 시험 데이터에 대한 실제 PICP* 값을 계산하고, 모델이 사전 정의된 기준인 80%의 포함 확률을 만족하는지를 평가하였다. Fig. 12는 시험 데이터에 대해 도출된 PICP*의 분포를 상자그림 형태로 시각화한 것이다. 반복 실험 결과, 시험 데이터에 대한 PICP*는 평균적으로 약 80% 내외를 유지하였으며, 대부분의 실험에서 ±4% 이내의 오차범위를 벗어나지 않는 것으로 나타났다. 이는 CQR이 보정 데이터에 과적합되지 않고, 독립된 시험 데이터에서도 일반화된 성능을 유지함을 의미한다. 또한, Case 1에서 관찰된 과도하게 넓은 신뢰구간과 이에 따른 PICP의 과대 추정 문제를 효과적으로 제어할 수 있음을 보여준다. 따라서, Case 2에서 제안한 수정된 CQR은 예측 신뢰도 지표(PICP* = 80%)를 안정적으로 만족시키는 동시에, 과도하게 넓은 신뢰구간을 합리적으로 축소함으로써 EUR 예측 불확실성에 대한 타당한 범위를 확보할 수 있는 방법임이 검증되었다.
Fig. 13은 Case 1과 Case 2에서 도출된 P10−P90 및 P10*−P90*의 예측구간을 비교한 그래프이다. 분석결과, Case 2에서는 사전 정의된 PICP* = 80% 조건을 만족하면서 Case 1 대비 전반적으로 더 좁은 예측구간을 유지하는 것으로 나타났다. 특히 24개월 생산자료를 입력 변수로 사용할 경우, 예측구간 길이가 3.92 stb/ft로 Case 1의 7.02 stb/ft에 비해 크게 감소한 것을 확인할 수 있다. 이는 예측 정보의 양이 충분할 때 보정 기법이 과도한 불확실성 확대를 효과적으로 억제함을 보여준다. 결과적으로, 보정된 분위수 경계인 P90* 및 P10*을 적용함으로써, 예측 신뢰수준을 정량적으로 통제하면서도, 이론적 타당성에 부합하는 불확실성 표현이 가능함을 확인하였다. 이는 Fig. 10에서 설명한 한계를 효과적으로 극복함을 보여준다.
Table 5는 신뢰구간 보정 이후, 각 시험 데이터의 실제 EUR 값이 보정된 분위수인 P90* 및 P10*의 범위를 벗어난 평균 비율을 정리한 것이다. 전체 시험 샘플 중 약 9.6%는 P90*보다 작았고, 10.4%는 P10*보다 큰 값을 보였다. 이는 두 분위수 사이의 예측구간이 전체 데이터의 약 80%를 포함하고 있음을 의미한다.
Table 5.
Percentage of observations outside the P90*‒P10* interval
| Value | |
| Proportion below P90* (%) | 9.6 |
| Proportion above P10* (%) | 10.4 |
Fig. 14는 식 (9)를 통해 보정된 중앙값 P50*를 산정하기 위해 결정된 보정계수 𝛽의 분포를 나타낸 것이다. 분석결과, 𝛽는 대부분 −3에서 +3의 범위 내에서 결정되었으며, 전반적으로 큰 변동 없이 일정한 수준을 유지하는 경향을 보였다. 이는 P50*이 원래 RF 모델에서 도출된 중앙값 예측치 P50과 매우 유사하게 유지되었음을 의미한다. 즉, 보정절차는 주로 예측구간 경계값인 P90*, P10*의 조정에 집중되었으며, 중앙값 예측인 P50*에는 상대적으로 미미한 영향을 미쳤다. 이는 예측 분포의 중심이 유지되었음을 의미하며, 결과적으로 모델의 예측 구조가 대칭성을 갖는다는 점을 확인할 수 있다.
Fig. 15는 Table 4에 제시된 특정 생산정을 대상으로 보정된 분위수 예측값인 P90*, P50*, P10*을 계산하고, 이를 Fig. 10(a)에 추가하여 기존 분위수 예측값(P90, P50, P10)과 비교한 그래프이다. 분석결과, 보정된 신뢰구간 경계값인 P90* 및 P10*은 PICP* = 80% 조건을 충족하기 때문에 P90, P10보다 EUR 예측 구간의 폭이 축소되었다. 이는 EUR 예측에 유효한 입력 정보가 많을수록 예측 불확실성이 줄어든다는 사실에 부합하는 것이다. 반면, 보정된 중앙값 P50*는 원래의 P50과 거의 유사한 값을 유지하였다. 즉, RF 모델이 산출한 50% 분위수 예측이 본질적으로 안정적이며, 보정 없이도 신뢰할 수 있는 중심 추정값으로 활용 가능함을 확인하였다.
결 론
이 연구에서는 Eagle Ford Shale 지역의 셰일오일 생산정을 대상으로 RF의 분위수 회귀모델을 활용하여 EUR 예측과 그에 따른 불확실성을 분석하였다. 기존 QRF 분위수 회귀를 통해 도출한 P90 및 P10을 사용하여 예측구간 포함확률인 PICP를 구한 결과 이론상 기대치인 80%를 현저히 초과하는 현상을 보였다. 특히, 월별 생산자료를 입력 변수로 사용하는 경우 PICP는 95% 이상으로 나타났다. 이는 P90, P10의 신뢰구간 폭이 과도하게 산정된 것을 의미한다.
이를 극복하기 위해 신뢰구간의 폭은 줄이되 PICP는 80% 수준으로 유지할 수 있도록 예측구간의 경계 보정기법인 수정된 CQR을 적용하였다. CQR 모델로부터 적정 신뢰수준을 유지하면서 불확실성의 합리적 정량화가 가능함을 확인하였다. 또한, 중앙값 예측치인 P50은 보정기법 적용 전후에 큰 차이를 보이지 않아, 50% 분위수인 P50이 적정한 평가량임을 확인하였다. 이는 RF 분위수 모델의 예측 구조가 안정적이며, 중심값 예측은 신뢰할 수 있는 상태로 유지된다는 것을 의미한다.
본 연구에서 제안한 기법은 셰일저류층 생산 예측뿐만 아니라 다양한 불확실성 분석에서 적정 신뢰수준에 대한 불확실성의 정량적 평가에 활용될 수 있다.
















