Daumsoft
Top

SOFIA Platform

SOFIA는 비즈니스 전 과정을 도와주는 빅데이터 인공지능 플랫폼입니다.

그리스어로 '지혜'를 뜻하는 빅데이터 인공지능 플랫폼 SOFIA는 데이터에서 정보, 지식, 지혜를 발굴하는 인공지능 · 빅데이터 기술의 집약체입니다.
SOFIA는 데이터의 수집에서 분석, 인사이트 발굴 그리고 의사결정에 이르는 비즈니스 전 과정을 수행합니다.
심층적 의미 이해 기반의 설명가능한“인공지능 기술”

거대한 지식베이스와 자연어처리, 기계학습 기술을 바탕으로 자연어와 수치 데이터에 대한 의미를 이해하고
내재된 패턴 인식을 통해 문제를 해결한 후 사람이 이해할 수 있도록 분석 결과에 대한 해석을 제공하는 기술입니다.

    Core NLP
  • Core NLP는 자연 언어 이해 및 생성을 위한 시스템입니다.
  • Core NLP는 형태소 분석, 패러프레이징, 구문분석, 의미 분석, 그리고 의도 분석을 이용하여 자연어에 대한 심층적 분석을 수행합니다.
  • 구문 관계를 고려한 정규화, 개별 형태소의 의미, 표현의 의미까지 고려함으로써 사람들의 행위나 사실, 미묘한 감성까지 분석합니다.
  • 자연어 이해, 자연어 생성, 심층적 언어 분석
    Deep AI
  • AI 코어 엔진으로 기계 학습 및 통계 분석을 통한 추론 및 예측, 텍스트마이닝 및 데이터 마이닝을 수행하는 문제 해결을 위한 핵심 기술입니다.
  • Deep AI에는 기계학습을 기반으로 대용량 데이터에 대한 연관관계 분석, 감성 분석, 분류, 클러스터링, 요약, 시계열 분석, 예측, 관계 추론 등 다양한 분석 프로그램이 탑재되어 있습니다.
  • 연관관계 학습, 분류, 클러스터링, 감성 분석, 요약, 추론, 시계열 분석, 예측, 가설 검증
    Visual Repository
  • Visual Repository는 트렌드맵 및 Deep AI, 자연어 생성 등 SOFIA 플랫폼의 기본 엔진을 이용하여 자동으로 데이터를 분석하고 인사이트 리포트까지 작성해 주기 위한 다양한 시각화 모듈을 탑재하고 있습니다.
    Explanatory Agent
  • 인간을 위해 분석된 내용을 그림과 글, 대화를 이용해 설명할 수 있는 체계를 갖춘 설명가능한 인공지능 기술입니다.
  • – AI Report : 사람을 대신해 데이터의 수집, 분석은 물론 사람이 이해하기 쉽도록 그림과 글을 이용해 리포트를 자동으로 생성합니다.
  • – AI Chatbot : 자연어 대화를 통하여 질문에 대한 답을 얻을 수 있도록 하는기술입니다.
    데이터 수집
  • 다음소프트의 수집엔진 'Mining Spider'는 분석 시스템에서 필요로 하는 데이터를 안정성, 즉시성, 포괄성, 목적성을 바탕으로 수집합니다.
  • 커뮤니티, 블로그, 트위터, 인스타그램, 유튜브를 포함한 278억 건의 비정형 데이터와 국가 통계 및 금융, IoT 데이터를 포함한 정형 데이터가 수집되고 있습니다.
  • 데이터의 안정적 수집이 가능하도록 24/7 모니터링 시스템을 갖추고 있습니다.
  • 비정형 데이터, 정형데이터, Mining Spider
    지식베이스
  • 지식베이스는 인공지능 시스템이 보다 전문적이고 지능적으로 작동하기 위해 필요한 구성 요소입니다.
  • 지식베이스는 언어처리 지식과 온톨로지나 이벤트, 대화지식과 같은 실세계지식, 그리고 도메인별 감성 지식으로 이루어 집니다.
  • 다음소프트의 지식베이스는 기계 학습에 의한 자동화된 지식 획득과 사람의 수작업에 의한 분류 체계 구성 및 정련에 의해 구축됩니다.
  • 언어처리지식, 실세계지식, 감성지식
    빅데이터 처리
  • 초대용량의 지식맵을 저장하기 위해 다음소프트는 하둡 빅데이터 프레임워크를 기반으로 Big Index라는 기술을 개발했습니다.
  • 빅데이터 처리를 위해 하나의 작업은 태스크라는 작은 단위로 나뉘어 각 노드에 분산/병렬 처리됩니다.
  • Hadoop
    트렌드맵
  • 트렌드맵은 소셜미디어와 뉴스와 같은 비정형 데이터의 요약적 표현을 통해 사람들의 삶과 역사를 지식화한 초대용량의 지식맵입니다.
  • 텍스트를 요약적으로 표현하되 그 의미를 잃지 않기 위해 다음소프트의 자연어처리를 이용해 키워드, 키프레이즈, 키팩트를 추출합니다.
  • 질의어에 대한 시계열 추이, 연관관계, 감성, 사람들의 행위 및 이들의 시간에 따른 변화가 API를 통해 제공됨으로써 사회의 스토리와 히스토리를 분석할 수 있습니다.
  • 초대용량 지식맵, 추론