분류 전체보기304 다수의 결정 트리들을 학습 Random Forest -3 변형 및 확장극도로 무작 위화 된 트리(ExtraTrees)ExtraTrees 또는 Extremely Randomized Trees는 트리 구성 과정에서 더 많은 무작위성을 도입하는 Random Forest의 변형이다. 임의의 기능 하위 집합 중에서 최상의 분할을 선택하는 Random Forest와 달리 ExtraTrees는 최적의 분할을 검색하지 않고 완전히 무작위로 분할을 선택한다. 알고리즘이 각 분할을 최적화하는 데 시간을 소비하지 않기 때문에 이러한 추가 무작위성은 분산을 줄이고 훈련 시간을 단축할 수 있으며, ExtraTrees는 모델 분산을 더욱 줄여 특정 데이터 세트, 특히 노이즈 수준이 높은 데이터 세트에서 Random Forest와 유사하거나 더 나은 성능을 보이는 경우가 많다.기능 선택.. 2025. 1. 11. 다수의 결정 트리들을 학습 Random Forest -2 랜덤 포레스트의 응용의료의료 부문에서 Random Forest는 질병 예측, 의료 영상 분석 및 환자 결과 예측에 광범위하게 사용된다. 예를 들어, 환자 인구통계, 병력 및 실험실 결과를 기반으로 당뇨병이나 암과 같은 질병의 가능성을 예측할 수 있으며, 의료 영상 분야에서 Random Forest는 진단 목적으로 영상을 분류하여 방사선 전문의가 종양이나 골절과 같은 이상을 식별하는 데 도움을 주고 있다. 또한 환자 재입원율을 예측하는 데 도움이 되므로 병원에서 예방 조치를 구현하고 환자 치료를 개선하는 부분에서는 도움을 주고 있다.재원금융 산업, 특히 신용 평가 및 사기 탐지 분야에서 중추적인 역할을 하는데, Random Forest 모델은 재무 이력, 소득 수준, 고용 상태 및 기타 관련 기능을 분석.. 2025. 1. 10. 다수의 결정 트리들을 학습 Random Forest -1 랜덤 포레스트 구조 및 메커니즘다중 의사결정 트리 구축Random Forest는 훈련 과정에서 수많은 의사 결정 트리를 구성한다. 각 트리는 원본 데이터 세트의 다른 부트스트랩 샘플을 사용하여 구축되므로 각 트리가 약간 다른 데이터 하위 집합에 대해 훈련되었다. 트리 간의 이러한 다양성은 모든 트리가 동일한 오류를 범할 가능성을 줄이므로 앙상블 성능에 매우 중요한데, 노이즈를 포착하고 훈련 데이터에 과대적합할 수 있는 단일 결정 트리와 달리, Random Forest의 여러 트리를 집계하면 이러한 특이성을 완화하여 보다 정확하고 신뢰할 수 있는 예측을 얻을 수 있다.기능 무작위성트리 간의 다양성을 더욱 강화하고 상관관계를 줄이기 위해 Random Forest는 기능 선택 프로세스에 추가 무작위성 계층을.. 2025. 1. 10. 적대적 생성 신경망 GAN(Generative Adversarial Networks) 1. GAN의 기본 개념 생성적 적대 신경망(GAN)은 두 개의 신경망, 즉 생성자(Generator)와 판별자(Discriminator)가 서로 경쟁하며 학습하는 구조를 가진 딥러닝 모델이다. 생성자는 실제 데이터와 유사한 가짜 데이터를 생성하려고 시도하고, 판별자는 입력된 데이터가 실제 데이터인지 생성자가 만든 가짜 데이터인지를 구분하려고 노력하고 있으며, 이러한 상호 경쟁 과정에서 생성자는 점점 더 정교한 데이터를 만들어내고, 판별자는 이를 더욱 정확히 구분하게 된다. GAN의 기본 아이디어는 두 네트워크가 서로의 성능을 향상하는 방향으로 학습하면서, 결국 매우 현실적인 데이터를 생성할 수 있게 하는 데 있다. GAN의 여러 가지 기능을 알아보도록 하겠다.2. GAN의 구조2.1. 생성자(Gen.. 2025. 1. 9. 배깅(Bootstrap Aggregating)의 원리와 특징 배깅(Bootstrap Aggregating)이란?앙상블 학습에는 여러 모델을 결합하여 우수한 예측 시스템을 만드는 작업이 포함된다. 다양한 모델의 장점을 활용하여 전반적인 성능을 향상하고, 협업을 통해 개인의 약점을 줄인다. 부트스트랩 샘플링은 배닝의 핵심 기술로, 대체를 통한 무작위 샘플링을 포함하여 다양한 훈련 하위 집합을 생성하며, 원본 데이터의 약 63.2%가 각 샘플에 표시되어 효과적인 앙상블 학습에 필수적인 모델 다양성을 조성한다. 편향-분산 트레이드오프로 모델의 편향(가정으로 인한 오류)과 분산(데이터 변동에 대한 민감도로 인한 오류) 간의 균형을 맞추며, 편향을 증가시키지 않고 주로 분산을 줄여 분산이 큰 모델에 이상적입이다. 랜덤 포레스트의 영역에서는 의사결정 트리의 각 분할에서 기능 .. 2025. 1. 9. AlphaGo의 기원과 발전 알파고의 기원알파고는 알파벳의 구글 딥마인드에서 개발한 바둑 AI인공지능 프로그램이다. 오직 바둑만으로 프로기사를 이긴 최초의 프로그램이자 등장과 동시에 바둑의 패러다임을 완전히 바꿔버린 인공지능이기도 하다. 이름에서 "Go"란 일본어로 바둑을 뜻하는 碁(ご(go), 한국 음으로 바둑 기)를 의미하는데, 이는 일반적으로 서구 언론에서 바둑을 의미할 때 "고"란 말을 쓰기 때문에 지어진 이름이다. 2016년 3월 15일, 한국기원에서 (명예) 프로 九단 단증을 수여하게 되어 알파고 九단이 되었다. 또한, 객원기사 자격으로 한국기원에 등록되었기 때문에, 자격상으로는 언제든지 한국기원에서 개최하는 대회에 참가할 수 있다. AlphaGo의 가장 혁신적인 측면 중 하나는 학습을 활용하는 것인데, 이 정도는 A.. 2025. 1. 8. 이전 1 ··· 21 22 23 24 25 26 27 ··· 51 다음