DataFlow

머신러닝 데이터 모델링 소프트웨어

현장에서 수집된 계측 데이터를 기반으로 한 모델 생성 및 학습을 위해 개발된 머신러닝 알고리즘 데이터 모델링 소프트웨어입니다. DataFlow를 이용하여 플랜트 유입 및 처리수질 예측, 분리막 오염 분석 등 다양한 계측기반 환경분야에 활용할 수 있습니다.

손쉬운 시작

DataFlow는 스프레드시트에서 데이터 조회 및 편집이 가능하며, 간단한 설정만으로 손쉽게 데이터를 분석할 수 있습니다.

  • 엑셀(xls, xlsx) 또는 텍스트(csv) 파일 데이터 불러오기
  • 학습 알고리즘 파라미터 기본값 제공을 통한 간편한 모델 학습 수행
  • 학습된 모델 및 예측 결과 저장 / 불러오기
  • 모델별 학습 설정 기본값 최적화
  • 사용자 필요에 따라 알고리즘 파라미터 수정 가능
  • 데이터 전처리 기능(입 · 출력 항목 중 데이터 변동이 없는 항목, 이상치 제거 등)
  • 학습 및 테스트 데이터 선택 기능(순차, 무작위, 지정)
  • 다수 모델 동시 학습, 학습 결과 요약 지원
  • 한글 메뉴 및 사용자 지침서 지원
  • 온라인 업데이트 지원

입력항목 선택 최적화

DataFlow는 학습 모델의 다양한 입력항목 조합에 따른
모델 학습결과를 비교하여 최적 모델을 선정합니다.

  • 모델의 입력항목 개수 범위 지정
  • 입력항목의 조합별 모델링 전체 수행
  • 학습결과 성능이 우수한 순으로 결과 표시
  • 성능이 우수한 모델이 많이 포함된 변수 추출
  • 분석결과 복사 및 내보내기

기초 통계 분석

DataFlow는 엑셀형태로 구성된 사용자데이터의 평균, 분산, 표준편차 등 단변량 통계량 연산과 주성분분석, 상관관계분석 등 다변량 데이터 분석기능을 제공하며, 예측/분류 모델의 입력항목을 선정하는데 도움이 되는 사전 분석을 수행할 수 있습니다.

  • 기초통계량(평균, 분산, 표준편차, 최대값, 최소값, 중간값 등)
  • 주성분 분석(PCA : Principal Component Analysis) 및 Score 변수 추가
  • 상관관계 분석(CA : Correlation Analysis)
  • 데이터 변환(Log, Power, Lead, Lag 등) 변수 추가

다양한 분석 기능 제공

모델링 목적에 맞게 사용할 수 있도록 다양한 알고리즘을 제공합니다. 각 알고리즘의 설정값은 다양한 사례로부터 도출된 최적값을 사용합니다.

    회귀분석
  • PLS(Partial Least Squares)
  • SVM(Support Vector Machine)
  • MLP(Multi-Layer Perceptron)
  • MLR(Multivariate Linear Regression)
  • RANSAC(Random Sample Consensus)
    분류분석
  • PLS-DA(PLS – Discriminant Analysis)
  • DT(Decision Tree)
  • Neural Network
  • KNN(K-Nearest Neighbor)
  • Kernel-SVM
    군집분석
  • K-Means
  • Balanced K-Means

이제 DataFlow를 시작하세요.

TRIAL
(1개월)
COMMERCIAL
(연간 구독)
PERPETUAL
(별도 견적)
DataFlow 데스크탑