여러 개의 센서를 시계열로 모니터링하다 보면, 각 센서는 저마다 값의 범위와 변동성이 다릅니다. 한 센서에서 갑작스런 “스텝 다운”이나 급격한 점프가 발생했을 때 원시 값만 보면 뚜렷하지만, 서로 스케일이 크게 다른 센서들의 표준편차를 단순히 Min–Max 스케일링으로 비교하면 오히려 오판할 수 있습니다. 이 글에서는 센서별 표준편차를 Min–Max 스케일링했을 때의 문제점을 살펴보고, 여러 센서를 포괄해 변동성을 좀 더 견고하게 비교하는 방법들을 단계별로 알아보겠습니다.표준편차의 Min–Max 스케일링이 오도할 수 있는 이유1. 과거 극값에 민감: Min–Max 스케일링은 센서별 과거 표준편차의 최소·최대값을 이용해 \[0, 1]로 변환합니다. 예컨대 A 센서가 0.1~~10을, B 센서가 100~~1..
안녕하세요. 균일한 레벨을 유지해야 하는 여러 센서 데이터에서 이상치를 감지하는 것은 제조업, 설비 관리, 환경 모니터링 등 다양한 분야에서 매우 중요한 작업입니다. 데이터가 안정적일 것으로 기대되기 때문에, 여기서 벗어나는 패턴을 효과적으로 찾아내는 것이 핵심입니다.여러 가지 접근 방법을 난이도와 특성에 따라 나누어 설명해 드리겠습니다.1. 통계적 기법 (Statistical Methods)가장 기본적이고 직관적인 방법입니다. 데이터가 특정 분포(예: 정규분포)를 따른다고 가정하고, 그 분포에서 크게 벗어나는 값을 이상치로 판단합니다.가. Z-Score (or Modified Z-Score)원리: 데이터 포인트가 평균으로부터 표준편차의 몇 배만큼 떨어져 있는지를 측정합니다. 보통 Z-Score의 절댓값..
안녕하세요. 시계열 데이터에서 'step down'과 같이 경향성(trend)이나 평균 수준(level)이 급격하게 변하는 지점을 탐지하는 것은 변화점 탐지(Change Point Detection) 또는 **구조적 변화 탐지(Structural Break Detection)**라고 부릅니다. 이는 매우 중요한 분석 중 하나이며, 다음과 같은 다양한 방법으로 접근할 수 있습니다.방법들은 간단한 시각적 방법부터 통계적 검정, 머신러닝 알고리즘까지 다양합니다.1. 시각적/직관적 방법 (가장 먼저 시도해야 할 방법)가장 간단하면서도 효과적인 방법입니다. 알고리즘을 적용하기 전에 반드시 데이터를 시각화하여 변화가 있는지 눈으로 확인해야 합니다.기본 시계열 플롯 (Time Series Plot): 데이터를 시간에..
반도체 제조 공정에서 압력 제어는 공정 품질과 수율에 직접적인 영향을 미치는 핵심 요소입니다. 최근에는 강화학습(Reinforcement Learning, RL) 등 인공지능(AI) 기술을 활용해 공정 장비의 압력 제어를 최적화하려는 연구와 특허 출원이 활발히 이루어지고 있습니다.1. 기존 압력 제어 특허 현황- 기존 특허들은 주로 센서 데이터를 기반으로 한 피드백 제어, 압력 밸런스 유지, 자동 보정 알고리즘 등에 초점을 맞추고 있습니다. 예를 들어, KR100801660B1 특허는 반도체 제조 설비의 압력 밸런스를 조절하기 위한 시스템 및 방법을 제시하며, 트랜스퍼 영역과 처리 탱크 등 각 구역의 압력을 실시간으로 측정·제어하는 기술을 다룹니다[3].- 또 다른 특허인 KR20030003803A는 공..
바쁜 평일 저녁, 냉장고에 남은 무·오이·채소들을 어떻게 활용할지 고민이라면 이 레시피 하나면 충분합니다. 집에서 간단하게 준비할 수 있는 새콤달콤 치킨무, 만능 장아찌, 그리고 브런치 카페 부럽지 않은 샐러드 드레싱까지, 단계별로 살펴볼게요.1. 새콤달콤 치킨무 준비하기 먼저 무 1개를 깍둑썰기하고, 물 500ml와 식초 400ml, 설탕 300ml, 소금 1큰술을 섞어 양념액을 만들어 둡니다. 썰어둔 무를 유리용기에 담고 양념액이 무를 충분히 덮도록 부은 뒤 실온에서 약 1시간 숙성하거나 냉장고에 넣어 하룻밤 두면 아삭한 치킨무가 완성됩니다. 이 방법만 기억하면 집에서 치킨을 주문해도 번거롭게 사서 꺼낼 필요가 없죠.2. 백종원표 만능 장아찌 만들기 진간장과 물을 같은 비율(2컵씩)로 준비한 ..
갤럭시 스마트폰을 초기화하는 것은 마치 새 스마트폰을 처음 샀을 때처럼 되돌리는 과정과 같습니다. 하지만 그만큼 중요한 결정을 내리는 것이기도 합니다. 초기화는 스마트폰에 저장된 모든 데이터, 즉 사진, 동영상, 연락처, 앱, 계정 정보 등을 완전히 삭제하기 때문입니다. 마치 깔끔하게 정리된 깨끗한 도화지처럼, 갤럭시 폰은 출고 당시의 상태로 돌아갑니다. 초기화, 왜 해야 할까요?갤럭시 폰을 초기화하는 이유는 다양합니다. 가장 흔한 경우는 다음과 같습니다.판매 또는 양도: 더 이상 사용하지 않는 갤럭시 폰을 다른 사람에게 판매하거나 양도할 때, 개인 정보를 보호하기 위해 초기화는 필수입니다.성능 문제 해결: 스마트폰이 느려지거나 앱 충돌, 오류 등 다양한 문제가 발생할 때, 초기화는 꽤 효과적인 해결책..
여름이 절정에 달하는 시기, 우리 조상들은 이 기간을 '삼복'이라 부르며 특별한 보양 문화를 발전시켜 왔습니다. 특히 무더위가 계속되는 삼복 기간에는 체력 관리가 무엇보다 중요합니다. 이번 포스팅에서는 2025년 삼복 날짜와 함께 이 시기에 즐길 수 있는 다양한 보양식을 소개해 드립니다.삼복의 의미와 2025년 날짜삼복은 '세 번의 복날'을 의미하는 말로, 한 해 중 가장 더위가 심한 초복, 중복, 말복을 통틀어 부르는 용어입니다. 음력을 기준으로 하지 이후 세 번째와 네 번째 경일에 각각 초복과 중복이, 입추 이후 첫 번째 경일에 말복이 찾아옵니다.2025년 삼복 날짜는 다음과 같습니다:- 초복: 7월 20일(일요일)- 중복: 7월 30일(수요일)- 말복: 8월 9일(토요일)이 기간은 일 최고기온이 3..
최근 시계열 데이터 분석 및 기계 학습 분야에서 복잡도-불변 거리(Complexity-Invariant Distance, CID)와 상관기반 거리(Correlation-Based Distance, CBD)가 중요한 측정 도구로 부상하고 있습니다. 본 연구는 두 거리 측정법의 수학적 기반, 알고리즘 특성, 실제 응용 사례를 체계적으로 비교 분석함으로써 각 기법의 장단점과 적용 가능 영역을 규명합니다. 특히 시계열 분류, 공간 데이터 분석, 신경망 성능 평가 등 다양한 분야에서의 실증적 결과를 제시하며, 이론적 배경과 현실 문제 간의 연계성을 입체적으로 조명합니다.복잡도-불변 거리와 상관기반 거리의 수학적 기반복잡도-불변 거리의 알고리즘 구조복잡도-불변 거리(CID)는 시계열의 형태적 복잡도를 정량화하여 기..
복잡도-불변 거리(Complexity-Invariant Distance, CID)는 시간 계열 데이터의 분류 및 유사성 측정 시 복잡도 차이로 인한 오류를 보정하기 위해 설계된 거리 측정 방법입니다. 기존 유클리드 거리(Euclidean Distance)나 DTW(Dynamic Time Warping)와 같은 방법들은 시계열의 형태적 차이는 고려하지만, 복잡도(예: 피크, 밸리의 수) 차이는 반영하지 못해 복잡한 형태의 시계열을 단순한 클래스로 오분류하는 문제가 있었습니다. CID는 이러한 문제를 해결하기 위해 복잡도를 보정하는 인자를 도입했습니다[1][3].핵심 개념1. 복잡도 추정(Complexity Estimate, CE) 시계열 T의 복잡도는 연속된 데이터 포인트 간 차이의 제곱합 제곱근으로..