1997. 3. 4. 13:52
내발자국[동호회]
[발췌] 심마니(http://simmany.hnc.com)의 "심마니란?"
---------------------------------------------------------------------------
한글정보검색시스템 심마니 심마니란?
◆ 심마니란? ◆ 심마니를 홈페이지 구성에 이용하는 방법
◆ 심마니의 의의 ◆ 심마니 검색창을 사용한 홈페이지 목록
◆ 심마니의 두드러진 특징 ◆ 심마니 광고 문의
◆ 심마니의 미래 ◆ 심마니 구입 문의
◆ 현재의 시스템 환경 ◆ (주)한글과컴퓨터 기술개발부문 자연어처리팀
◆ 심마니 검색 로봇
---------------------------------------------------------------------------
심마니
---------------------------------------------------------------------------
◆ 심마니란?
"심마니"는 (주)한글과컴퓨터(이하 '한컴')의 자연어처리팀에서 개발한
한글정보검색시스템(HIRS: Hangul Information Retrieval System)의
이름입니다.(자연어처리팀은 한컴의 기초 기술을 개발하는 "기술개발부문"에
소속된 네 개의 팀 중 하나입니다.)
심마니란 단어의 사전적인 의미는 "산삼 캐기를 업으로 삼는
사람"(우리말큰사전, 한글학회), "깊은 산에 들어가 산삼 캐는 것을 업으로 삼는
사람"(국어대사전, 금성출판사), 혹은 "산삼을 캐며 돌아다니는 일을 업으로
하는 사람"(새 우리말 큰사전, 삼성출판사) 등으로 나타나고 있습니다.
심마니는 "채삼꾼," "심메꾼," 혹은 "심만이"라고도 불리고 있으며, 우리 나라의
심마니들은 "심마니 말"이라 불리는 심마니들만의 용어를 가지고 있습니다.
"다리"를 "기둥저리"라 하고, "산삼"을 "부리시리"라 하며, "술"을
"마주보기"로, "밥"을 "무리니"로, "쌀"을 "모새"로 부르는 것은 심마니들의
용어로서 그들만의 독특한 세계가 있음을 알 수 있습니다.
또한 "심"은 "산삼"의 심마니 말이기도 하며, 중국의 [노해 하권 51]과 같은 옛
문헌에 보면 "이 심은 신라인 심이라."라는 표현이 나오기도 하여, 이것이 오래
전부터 쓰여 온 말임을 가르쳐 줍니다.
사전에는 "심만이->심마니," "심메 (명) 산으로 산삼을 캐러 가는 일. x
심뫼(틀림)." "심메 보다. (자) 산삼의 싹을 찾다." 등의 관련 내용이
있습니다.(새 우리말 큰사전, 삼성출판사) 그러므로 본 시스템의 심마니란
이름은 드넓은 정보의 바다로 상징되는 인터넷을 우리 나름으로 다르게 해석,
적용한 것입니다. 정보의 바다는 지나치게 넓고 깊어서 그 안에 담긴 하나
하나의 내용을 찾고자 하는 사람들에게 구체적인 대상이 아닙니다. 하지만
한컴은 드넓고 깊은 인터넷의 바다를 우리와 친숙한 높고, 깊은 산으로 보고
거기에 숨겨진 정보를 산삼과 같이 귀중한 것으로 바꿔 생각하기로 했습니다.
아무리 깊은 산이라고 하더라도, 또 아무리 찾기 힘든 산삼이라고 하더라도
심마니는 그것을 찾아내며 "심봤다!"를 외치면서 정보화사회를 사는 사람들의
희열을 표현코자 하는 것입니다.("심봤다!"는 심마니가 산삼을 찾았을 때 그것이
자기의 소유임을 다른 심마니들에게 알리는 용어입니다. "내가 산삼을
찾았다!"는 의미입니다.)
이제 여러분들께서도 충분히 이해하고 계시듯이, 한글정보검색시스템
"심마니"에는 높고, 깊은 산에 숨겨진 방대한 정보들 중에서 진정으로 사용자가
찾기를 기대하는 산삼과 같은 정보를 쉽게 찾아 준다는 뜻이 부여되어 있는
것입니다.
심마니의 구성 요소와 영문 표기
심마니 한글정보검색시스템은 세 가지의 다른 요소들이 결합되어 있는
시스템입니다.
첫째로는 웹(WWW: WorldWide Web)에 있는 문서를 자동으로 찾고, 그 문서를
모아오는 프로그램인 검색 로봇(search robot)이 있습니다.
둘째로는 로봇이 모아온 웹 정보를 색인(index) 처리한 후 이들 데이터 중에서
필요한 정보를 단시간 내에 찾아주는 정보 검색(정보 회수: IR)
엔진(Information Retrieval Engine)이라는 프로그램이 있습니다.
세번째로는 상기 요소들을 갖추고, 사용자의 검색 단어(검색어 혹은 주제어)
입력을 받아서 필요한 정보를 찾아주고, 기타 웹 전자게시판(Web BBS)의
서비스하는 시스템이 있습니다.(사용자 여러분들이 "심마니"라고 부르고 계신
바로 이 시스템입니다.)
한컴은 이 세 가지의 이름을 심마니라는 이름으로 통칭하고 있으며, 각기
"심마니 로봇," "심마니 검색 엔진("심마니 색인기" 포함), "심마니
한글정보검색시스템"이라고 부르고 있습니다.
이들에 대한 영문 표기는 SimBot(심봇: 심마니 로봇),"
SimSearch/SimIndexer(심서치: 심마니 서치 엔진/심인덱서: 심마니 색인기),
SIRS(서즈: 심마니 한글정보검색시스템/Simmany Information Retrieval
System)으로 합니다.
이전 쪽으로
---------------------------------------------------------------------------
◆ 심마니의 의의
흔히 접하는 영어권에서 만들어진 정보검색시스템은 이미 영어에 맞게 만들어진
시스템으로 영어의 특징만을 잘 나타내고 있을 뿐입니다. 그러므로, 한국어와
같은 교착어는 이 시스템으로 만족할 만한 결과를 얻기란 매우 힘든 실정입니다.
몇몇 국내의 정보검색시스템들이 이러한 영어권의 정보검색시스템을 그대로
수용하는 실정에서 우리 나라 고유의 멋을 지닌 한국적인 정보검색시스템이
필요하게 되었습니다.
이에 최고의 한글 워드프로세서를 개발하고 한국어 처리연구에 계속 노력하는
한컴이 한글의 우수성을 다시 한번 세계에 입증하고 대한민국의 정보화 추진을
앞당기는 계기로 한글정보검색시스템을 개발하게 되었습니다.
이전 쪽으로
---------------------------------------------------------------------------
◆ 심마니의 두드러진 특징
- 자동 색인
자연어 문서로 이루어진 실제 Text에서 이후의 검색을 위해 자동으로
색인을 만들어 줍니다.
- 빠른 색인, 정확한 색인
타 정보검색시스템과 비교되는 빠른 색인 속도, 한국어의 특성을 잘 반영한
정확한 색인은 사용자가 요구하는 정보를 쉽고 빠르게 찾게 도와줍니다.
- 빠른 검색 속도, 순위별 내용보기(weight)
자체 DB를 사용한 검색은 빠른 속도를 자랑하며, 찾은 정보들을 우선
순위별로 표현하므로 사용자는 대부분의 경우 나열되는 정보 중 제일 앞의
몇 개만 살펴보시면 됩니다.
- 자료 크기에 민감하지 않은 고정적인 검색 속도
검색 속도는 처리되는 실제 문서의 양이 많아질수록 많이 걸릴 수
있습니다. 하지만 심마니는 문서의 양에 크게 반응하지 않아 검색 속도는
거의 일정한 수준을 유지하며
- 빠른 보기(간결하고 빠른 내용 보기)
찾아진 정보의 원문을 보지 않고 일부만 간략히 먼저 찾아지는 정보와 함께
나타내고 있으므로 전체 내용을 쉽게 파악할 수 있습니다.
- 한글 외래어의 영어 참조 기능
외래어는 영어 문서에서도 등장할 수 있습니다. 이를 위해 심마니는 한글
외래어를 영문으로 변환하여 확대 검사해 보는 뛰어난 기능을 가지고
있습니다.
- 한글 유의어 사전의 참조 기능
찾고자 하는 정보를 뜻하는 낱말이 애매할 경우 한글 유의어를 참조하여
검색을 확장할 수 있습니다. 검색하고자 하는 낱말의 끝에 '#'만
달아보십시오. 확장이 가능한 낱말은 확장해 줍니다.
- 자연어 불리언 연산자 제공
한글로 혹은 영어로 연산자를 '그리고' 혹은 'and' 등으로 입력할 수
있습니다. 이는 연산자에 익숙하지 않은 사용자들을 위한 배려입니다.
- 자동 문서 분류
색인시 대상 문서를 여러 가지 분야별로 자동분류해 줍니다. 이는 검색시
효율을 높혀줄 수 있는 기능으로써 분야별 검색도 가능합니다.
- 신조어 인식 기능
자동 색인 시에 여러 문서에 쓰인 시사언어처럼 신조어들은 보통의
정보검색시스템이 놓치거나 아주 까다롭게 처리해 주어야 하는 부분입니다.
그러나 심마니는 이를 위해 사용자에게 요구하는 것이 없습니다. 단지 그
원시 문서만 있으면 알아서 자동으로 인식합니다.
- 실제 문서의 1/3 크기의 작은 정보파일 생성
심마니는 대부분의 정보검색시스템이 생성하는 실제 문서보다 큰
정보파일을 대폭 줄였습니다. 실제 문서의 1/3 크기만의 적은 시스템
자원의 사용만으로도 색인 결과를 저장할 수 있습니다.
- 동적 색인
현재 만들어진 색인어 정보 파일에 정보를 추가함으로써 더해지는 정보를
바로바로 추가할 수 있습니다. 색인 후에 새로운 문서가 추가되었다고
처음부터 색인을 다시 하실 필요가 없습니다.
이전 쪽으로
---------------------------------------------------------------------------
◆ 심마니의 미래
심마니는 현재 기업이나 여러 단체의 정보를 처리하기 위한 단일
정보검색시스템으로서 가질 수 있는 최대한의 정보를 처리하고 있습니다. 이
시스템의 미래는 여러분에게 있습니다. 이후 이 시스템은 사용자의 요구에
상응하는 우리 고유의 시스템으로 자라나게 될 것입니다.
이전 쪽으로
---------------------------------------------------------------------------
◆ 현재의 환경
심마니(인터넷 한글정보검색 서비스)는 (주)한글과컴퓨터에서 개발한 정보검색
엔진을 이용하여 만들었으며, 다양한 서비스와 빠른 정보전달을 위해 다음과
같은 시스템을 사용합니다.
WWW Server
시스템 : Sun Sparc Server 1000, 메모리 : 512MB, 하드 디스크 : 20GB, 스왑
디스크 : 2 GB
Robot Server
시스템 : Sun Ultra Sparc, 메모리 : 256MB, 하드 디스크 : 4GB
색인된 자료
심마니는 한글 정보의 빠른 전달을 위해 현재는 한글 정보에 한정하여 각 Web
Site를 색인하고 있습니다. (국내 Site, 외국 Site의 한국인 홈페이지, 한국과
관련있는 외국 Site 등)
이전 쪽으로
---------------------------------------------------------------------------
◆ 심마니 검색 로봇
저희 심마니 서비스에 쓰이는 심마니 검색 로봇은 로봇배제를 위한 제안
표준안을 지키고 있습니다.
현재의 인터넷에는 로봇이라는 떠다니는 인공체가 인터넷의 전체 효율을
떨어뜨릴 만큼 많아져 문제가 되고 있습니다. 그만큼 여러분들이 인터넷이
느리다라고 느끼는 정도가 커져서 피해는 여러분들이 입게 됩니다.
로봇배제란 이러한 로봇의 동작중 필요없는 접속을 줄여 결국 인터넷을
효율적으로 사용하자는 뜻에서 만들어진 표준안입니다. 이를 쉽게 설명하면 해당
호스트에서 /robots.txt라는 파일을 만들어 로봇접속을 원하지 않는 경로를
명시하면 해당 로봇은 이 파일을 먼저 참조하여 현재 검색대상 경로가 배제된
경로이면 이를 접속하지 않고 다음으로 넘어가 인터넷 자원을 절약하게 되는
방법입니다.
현재 심마니는 이러한 표준을 준수하며 더불어 사는 인터넷 세상을 가꾸어나가고
있습니다.
이전 쪽으로
---------------------------------------------------------------------------
◆ 심마니를 홈페이지 구성에 이용하는 방법
심마니를 홈페이지의 구성으로 사용하고 싶은 분들을 위해서 다음과 같은
방식으로 여러분들의 홈페이지에서 심마니를 사용하실 수 있습니다.
1. 심마니를 이용하실 수 있는 html 문서를 가져갑니다. 가져가시는 방법은
마우스로 html 문서를 선택해서 저장하시면 됩니다.
반드시 심마니에서 제공하는 html문서 형식으로 구성해야 합니다.
2. 심마니관리자에게 e-mail로 알립니다.
심마니는 여러분들께 유용한 정보를 전달하기위해 항상 노력하고 있습니다.
이전 쪽으로
---------------------------------------------------------------------------
◆ 심마니 광고 문의
실속있고 빠른 광고를 원하십니까? 심마니의 광고는 이를 해결해 드리고
있습니다. 여러분들의 홈페이지를 가장 많은 이들이 즐겨 찾는 성공의 공간으로
만들어 드립니다. 기타 자세한 문의는 심마니 관리자에게 연락주시기
바랍니다.(심마니 광고 문의)
이전 쪽으로
---------------------------------------------------------------------------
◆ 심마니 구입 문의
심마니 엔진은 방대한 양의 정보를 가진 단체나 기업에서 한글 정보검색시스템을
구축할 때 엔진으로 사용할 수 있으며 백과사전 등 많은 양의 정보가 들어있는
CD-ROM 타이틀의 검색 엔진으로도 채용할 수 있습니다. 또한 야후(Yahoo)나 알타
비스타(Alta Vista), 라이코스 (Lycos)에 견줄 수 있는 인터넷 디렉터리 서비스
시스템을 구축하거나 인트라넷(Intranet) 등 웹 서버와 사내 네트웍 서버를 함께
쓰는 사무실 및 그룹웨어 환경에서 필수적인 정보검색용 엔진으로서 획기적인
요소 기술 상품입니다.
- 네트웍, 그룹웨어 및 인트라넷을 사용하는 기업 내의 문서
정보검색시스템
- 멀티미디어 타이틀의 전문서 색인 검색 엔진
- 일반 BBS의 정보검색시스템
- 언론사의 기사 정보 조회시스템
이러한 심마니 엔진은 기술 라이선스의 형태로 현재 판매하고 있습니다. 기타
자세한 문의는 심마니 관리자에게 연락을 주시기 바랍니다.(심마니 구입 문의)
이전 쪽으로
---------------------------------------------------------------------------
◆ (주)한글과컴퓨터 기술개발부문 자연어처리팀
한컴의 자연어처리팀은 꾸준한 연구자세로 우수한 우리 나라 언어인 한국어를
처리하는 더 나은 기술들의 개발에 계속 노력하고 있습니다. 밖으로 외국의
우수한 자연어처리 기술을 받아들여 한국적인 우리 고유의 기능으로
자리매김시키며 안으로는 자국의 자연어처리의 부흥을 위해 여러 연구단체를
지원, 협력하고 있습니다.
[Image] 개발된 기술 사례
한글맞춤법검사기, 한글 유의어 사전, 한영자동전환,
빠른교정, 각종 후처리기, 영어자동생성기, 한국어사전 제작
키트
개발 준비중인 과제
기계번역, 문법검사기, 문체검사기, 자연어명령어 인식기
팀구성 : 7명
팀장 : 이영식(ailove@hnc.co.kr)
팀원 : 황호정(hjhwang@hnc.co.kr)
주미혜(romio@hnc.co.kr)
허윤영(yyhur@hnc.co.kr)
정수경(iris@hnc.co.kr)
박호균(hokyun@hnc.co.kr)
이경재(bawidul@hnc.co.kr)
이전 쪽으로
---------------------------------------------------------------------------
심마니
[강좌내용문의]
=-=-=-=-=-* Lee,Kyoung (solbawoo) 이경 (솔바우) 李炅 (松巖) *-=-=-=-=-=
*솔아로미* *정보서비스* Phone: +82-331-253-9009 +82-331-48-6804
산업정보,화학정보,무역정보 zipcode: 440-302
검색-번역-가공-출판기획 Address: 30-23,Jung-Ja 2dong,Jang-An ku
SOL Aromi Information Services Suwon,Kyung-Ki do,KOREA
Industry,Chemistry,Trading Informatons
mailto:leesun2@soback.kornet.nm.kr mailto:leesun2@usa.net
=-=-=-=-=-=-=-=-* http://soback.kornet.nm.kr/~leesun2 *-=-=-=-=-=-=-=-=
제목에 "솔"자를 넣으면 긴급시에 편리합니다.
Please type "sol" in subject line to send me.
---------------------------------------------------------------------------
한글정보검색시스템 심마니 심마니란?
◆ 심마니란? ◆ 심마니를 홈페이지 구성에 이용하는 방법
◆ 심마니의 의의 ◆ 심마니 검색창을 사용한 홈페이지 목록
◆ 심마니의 두드러진 특징 ◆ 심마니 광고 문의
◆ 심마니의 미래 ◆ 심마니 구입 문의
◆ 현재의 시스템 환경 ◆ (주)한글과컴퓨터 기술개발부문 자연어처리팀
◆ 심마니 검색 로봇
---------------------------------------------------------------------------
심마니
---------------------------------------------------------------------------
◆ 심마니란?
"심마니"는 (주)한글과컴퓨터(이하 '한컴')의 자연어처리팀에서 개발한
한글정보검색시스템(HIRS: Hangul Information Retrieval System)의
이름입니다.(자연어처리팀은 한컴의 기초 기술을 개발하는 "기술개발부문"에
소속된 네 개의 팀 중 하나입니다.)
심마니란 단어의 사전적인 의미는 "산삼 캐기를 업으로 삼는
사람"(우리말큰사전, 한글학회), "깊은 산에 들어가 산삼 캐는 것을 업으로 삼는
사람"(국어대사전, 금성출판사), 혹은 "산삼을 캐며 돌아다니는 일을 업으로
하는 사람"(새 우리말 큰사전, 삼성출판사) 등으로 나타나고 있습니다.
심마니는 "채삼꾼," "심메꾼," 혹은 "심만이"라고도 불리고 있으며, 우리 나라의
심마니들은 "심마니 말"이라 불리는 심마니들만의 용어를 가지고 있습니다.
"다리"를 "기둥저리"라 하고, "산삼"을 "부리시리"라 하며, "술"을
"마주보기"로, "밥"을 "무리니"로, "쌀"을 "모새"로 부르는 것은 심마니들의
용어로서 그들만의 독특한 세계가 있음을 알 수 있습니다.
또한 "심"은 "산삼"의 심마니 말이기도 하며, 중국의 [노해 하권 51]과 같은 옛
문헌에 보면 "이 심은 신라인 심이라."라는 표현이 나오기도 하여, 이것이 오래
전부터 쓰여 온 말임을 가르쳐 줍니다.
사전에는 "심만이->심마니," "심메 (명) 산으로 산삼을 캐러 가는 일. x
심뫼(틀림)." "심메 보다. (자) 산삼의 싹을 찾다." 등의 관련 내용이
있습니다.(새 우리말 큰사전, 삼성출판사) 그러므로 본 시스템의 심마니란
이름은 드넓은 정보의 바다로 상징되는 인터넷을 우리 나름으로 다르게 해석,
적용한 것입니다. 정보의 바다는 지나치게 넓고 깊어서 그 안에 담긴 하나
하나의 내용을 찾고자 하는 사람들에게 구체적인 대상이 아닙니다. 하지만
한컴은 드넓고 깊은 인터넷의 바다를 우리와 친숙한 높고, 깊은 산으로 보고
거기에 숨겨진 정보를 산삼과 같이 귀중한 것으로 바꿔 생각하기로 했습니다.
아무리 깊은 산이라고 하더라도, 또 아무리 찾기 힘든 산삼이라고 하더라도
심마니는 그것을 찾아내며 "심봤다!"를 외치면서 정보화사회를 사는 사람들의
희열을 표현코자 하는 것입니다.("심봤다!"는 심마니가 산삼을 찾았을 때 그것이
자기의 소유임을 다른 심마니들에게 알리는 용어입니다. "내가 산삼을
찾았다!"는 의미입니다.)
이제 여러분들께서도 충분히 이해하고 계시듯이, 한글정보검색시스템
"심마니"에는 높고, 깊은 산에 숨겨진 방대한 정보들 중에서 진정으로 사용자가
찾기를 기대하는 산삼과 같은 정보를 쉽게 찾아 준다는 뜻이 부여되어 있는
것입니다.
심마니의 구성 요소와 영문 표기
심마니 한글정보검색시스템은 세 가지의 다른 요소들이 결합되어 있는
시스템입니다.
첫째로는 웹(WWW: WorldWide Web)에 있는 문서를 자동으로 찾고, 그 문서를
모아오는 프로그램인 검색 로봇(search robot)이 있습니다.
둘째로는 로봇이 모아온 웹 정보를 색인(index) 처리한 후 이들 데이터 중에서
필요한 정보를 단시간 내에 찾아주는 정보 검색(정보 회수: IR)
엔진(Information Retrieval Engine)이라는 프로그램이 있습니다.
세번째로는 상기 요소들을 갖추고, 사용자의 검색 단어(검색어 혹은 주제어)
입력을 받아서 필요한 정보를 찾아주고, 기타 웹 전자게시판(Web BBS)의
서비스하는 시스템이 있습니다.(사용자 여러분들이 "심마니"라고 부르고 계신
바로 이 시스템입니다.)
한컴은 이 세 가지의 이름을 심마니라는 이름으로 통칭하고 있으며, 각기
"심마니 로봇," "심마니 검색 엔진("심마니 색인기" 포함), "심마니
한글정보검색시스템"이라고 부르고 있습니다.
이들에 대한 영문 표기는 SimBot(심봇: 심마니 로봇),"
SimSearch/SimIndexer(심서치: 심마니 서치 엔진/심인덱서: 심마니 색인기),
SIRS(서즈: 심마니 한글정보검색시스템/Simmany Information Retrieval
System)으로 합니다.
이전 쪽으로
---------------------------------------------------------------------------
◆ 심마니의 의의
흔히 접하는 영어권에서 만들어진 정보검색시스템은 이미 영어에 맞게 만들어진
시스템으로 영어의 특징만을 잘 나타내고 있을 뿐입니다. 그러므로, 한국어와
같은 교착어는 이 시스템으로 만족할 만한 결과를 얻기란 매우 힘든 실정입니다.
몇몇 국내의 정보검색시스템들이 이러한 영어권의 정보검색시스템을 그대로
수용하는 실정에서 우리 나라 고유의 멋을 지닌 한국적인 정보검색시스템이
필요하게 되었습니다.
이에 최고의 한글 워드프로세서를 개발하고 한국어 처리연구에 계속 노력하는
한컴이 한글의 우수성을 다시 한번 세계에 입증하고 대한민국의 정보화 추진을
앞당기는 계기로 한글정보검색시스템을 개발하게 되었습니다.
이전 쪽으로
---------------------------------------------------------------------------
◆ 심마니의 두드러진 특징
- 자동 색인
자연어 문서로 이루어진 실제 Text에서 이후의 검색을 위해 자동으로
색인을 만들어 줍니다.
- 빠른 색인, 정확한 색인
타 정보검색시스템과 비교되는 빠른 색인 속도, 한국어의 특성을 잘 반영한
정확한 색인은 사용자가 요구하는 정보를 쉽고 빠르게 찾게 도와줍니다.
- 빠른 검색 속도, 순위별 내용보기(weight)
자체 DB를 사용한 검색은 빠른 속도를 자랑하며, 찾은 정보들을 우선
순위별로 표현하므로 사용자는 대부분의 경우 나열되는 정보 중 제일 앞의
몇 개만 살펴보시면 됩니다.
- 자료 크기에 민감하지 않은 고정적인 검색 속도
검색 속도는 처리되는 실제 문서의 양이 많아질수록 많이 걸릴 수
있습니다. 하지만 심마니는 문서의 양에 크게 반응하지 않아 검색 속도는
거의 일정한 수준을 유지하며
- 빠른 보기(간결하고 빠른 내용 보기)
찾아진 정보의 원문을 보지 않고 일부만 간략히 먼저 찾아지는 정보와 함께
나타내고 있으므로 전체 내용을 쉽게 파악할 수 있습니다.
- 한글 외래어의 영어 참조 기능
외래어는 영어 문서에서도 등장할 수 있습니다. 이를 위해 심마니는 한글
외래어를 영문으로 변환하여 확대 검사해 보는 뛰어난 기능을 가지고
있습니다.
- 한글 유의어 사전의 참조 기능
찾고자 하는 정보를 뜻하는 낱말이 애매할 경우 한글 유의어를 참조하여
검색을 확장할 수 있습니다. 검색하고자 하는 낱말의 끝에 '#'만
달아보십시오. 확장이 가능한 낱말은 확장해 줍니다.
- 자연어 불리언 연산자 제공
한글로 혹은 영어로 연산자를 '그리고' 혹은 'and' 등으로 입력할 수
있습니다. 이는 연산자에 익숙하지 않은 사용자들을 위한 배려입니다.
- 자동 문서 분류
색인시 대상 문서를 여러 가지 분야별로 자동분류해 줍니다. 이는 검색시
효율을 높혀줄 수 있는 기능으로써 분야별 검색도 가능합니다.
- 신조어 인식 기능
자동 색인 시에 여러 문서에 쓰인 시사언어처럼 신조어들은 보통의
정보검색시스템이 놓치거나 아주 까다롭게 처리해 주어야 하는 부분입니다.
그러나 심마니는 이를 위해 사용자에게 요구하는 것이 없습니다. 단지 그
원시 문서만 있으면 알아서 자동으로 인식합니다.
- 실제 문서의 1/3 크기의 작은 정보파일 생성
심마니는 대부분의 정보검색시스템이 생성하는 실제 문서보다 큰
정보파일을 대폭 줄였습니다. 실제 문서의 1/3 크기만의 적은 시스템
자원의 사용만으로도 색인 결과를 저장할 수 있습니다.
- 동적 색인
현재 만들어진 색인어 정보 파일에 정보를 추가함으로써 더해지는 정보를
바로바로 추가할 수 있습니다. 색인 후에 새로운 문서가 추가되었다고
처음부터 색인을 다시 하실 필요가 없습니다.
이전 쪽으로
---------------------------------------------------------------------------
◆ 심마니의 미래
심마니는 현재 기업이나 여러 단체의 정보를 처리하기 위한 단일
정보검색시스템으로서 가질 수 있는 최대한의 정보를 처리하고 있습니다. 이
시스템의 미래는 여러분에게 있습니다. 이후 이 시스템은 사용자의 요구에
상응하는 우리 고유의 시스템으로 자라나게 될 것입니다.
이전 쪽으로
---------------------------------------------------------------------------
◆ 현재의 환경
심마니(인터넷 한글정보검색 서비스)는 (주)한글과컴퓨터에서 개발한 정보검색
엔진을 이용하여 만들었으며, 다양한 서비스와 빠른 정보전달을 위해 다음과
같은 시스템을 사용합니다.
WWW Server
시스템 : Sun Sparc Server 1000, 메모리 : 512MB, 하드 디스크 : 20GB, 스왑
디스크 : 2 GB
Robot Server
시스템 : Sun Ultra Sparc, 메모리 : 256MB, 하드 디스크 : 4GB
색인된 자료
심마니는 한글 정보의 빠른 전달을 위해 현재는 한글 정보에 한정하여 각 Web
Site를 색인하고 있습니다. (국내 Site, 외국 Site의 한국인 홈페이지, 한국과
관련있는 외국 Site 등)
이전 쪽으로
---------------------------------------------------------------------------
◆ 심마니 검색 로봇
저희 심마니 서비스에 쓰이는 심마니 검색 로봇은 로봇배제를 위한 제안
표준안을 지키고 있습니다.
현재의 인터넷에는 로봇이라는 떠다니는 인공체가 인터넷의 전체 효율을
떨어뜨릴 만큼 많아져 문제가 되고 있습니다. 그만큼 여러분들이 인터넷이
느리다라고 느끼는 정도가 커져서 피해는 여러분들이 입게 됩니다.
로봇배제란 이러한 로봇의 동작중 필요없는 접속을 줄여 결국 인터넷을
효율적으로 사용하자는 뜻에서 만들어진 표준안입니다. 이를 쉽게 설명하면 해당
호스트에서 /robots.txt라는 파일을 만들어 로봇접속을 원하지 않는 경로를
명시하면 해당 로봇은 이 파일을 먼저 참조하여 현재 검색대상 경로가 배제된
경로이면 이를 접속하지 않고 다음으로 넘어가 인터넷 자원을 절약하게 되는
방법입니다.
현재 심마니는 이러한 표준을 준수하며 더불어 사는 인터넷 세상을 가꾸어나가고
있습니다.
이전 쪽으로
---------------------------------------------------------------------------
◆ 심마니를 홈페이지 구성에 이용하는 방법
심마니를 홈페이지의 구성으로 사용하고 싶은 분들을 위해서 다음과 같은
방식으로 여러분들의 홈페이지에서 심마니를 사용하실 수 있습니다.
1. 심마니를 이용하실 수 있는 html 문서를 가져갑니다. 가져가시는 방법은
마우스로 html 문서를 선택해서 저장하시면 됩니다.
반드시 심마니에서 제공하는 html문서 형식으로 구성해야 합니다.
2. 심마니관리자에게 e-mail로 알립니다.
심마니는 여러분들께 유용한 정보를 전달하기위해 항상 노력하고 있습니다.
이전 쪽으로
---------------------------------------------------------------------------
◆ 심마니 광고 문의
실속있고 빠른 광고를 원하십니까? 심마니의 광고는 이를 해결해 드리고
있습니다. 여러분들의 홈페이지를 가장 많은 이들이 즐겨 찾는 성공의 공간으로
만들어 드립니다. 기타 자세한 문의는 심마니 관리자에게 연락주시기
바랍니다.(심마니 광고 문의)
이전 쪽으로
---------------------------------------------------------------------------
◆ 심마니 구입 문의
심마니 엔진은 방대한 양의 정보를 가진 단체나 기업에서 한글 정보검색시스템을
구축할 때 엔진으로 사용할 수 있으며 백과사전 등 많은 양의 정보가 들어있는
CD-ROM 타이틀의 검색 엔진으로도 채용할 수 있습니다. 또한 야후(Yahoo)나 알타
비스타(Alta Vista), 라이코스 (Lycos)에 견줄 수 있는 인터넷 디렉터리 서비스
시스템을 구축하거나 인트라넷(Intranet) 등 웹 서버와 사내 네트웍 서버를 함께
쓰는 사무실 및 그룹웨어 환경에서 필수적인 정보검색용 엔진으로서 획기적인
요소 기술 상품입니다.
- 네트웍, 그룹웨어 및 인트라넷을 사용하는 기업 내의 문서
정보검색시스템
- 멀티미디어 타이틀의 전문서 색인 검색 엔진
- 일반 BBS의 정보검색시스템
- 언론사의 기사 정보 조회시스템
이러한 심마니 엔진은 기술 라이선스의 형태로 현재 판매하고 있습니다. 기타
자세한 문의는 심마니 관리자에게 연락을 주시기 바랍니다.(심마니 구입 문의)
이전 쪽으로
---------------------------------------------------------------------------
◆ (주)한글과컴퓨터 기술개발부문 자연어처리팀
한컴의 자연어처리팀은 꾸준한 연구자세로 우수한 우리 나라 언어인 한국어를
처리하는 더 나은 기술들의 개발에 계속 노력하고 있습니다. 밖으로 외국의
우수한 자연어처리 기술을 받아들여 한국적인 우리 고유의 기능으로
자리매김시키며 안으로는 자국의 자연어처리의 부흥을 위해 여러 연구단체를
지원, 협력하고 있습니다.
[Image] 개발된 기술 사례
한글맞춤법검사기, 한글 유의어 사전, 한영자동전환,
빠른교정, 각종 후처리기, 영어자동생성기, 한국어사전 제작
키트
개발 준비중인 과제
기계번역, 문법검사기, 문체검사기, 자연어명령어 인식기
팀구성 : 7명
팀장 : 이영식(ailove@hnc.co.kr)
팀원 : 황호정(hjhwang@hnc.co.kr)
주미혜(romio@hnc.co.kr)
허윤영(yyhur@hnc.co.kr)
정수경(iris@hnc.co.kr)
박호균(hokyun@hnc.co.kr)
이경재(bawidul@hnc.co.kr)
이전 쪽으로
---------------------------------------------------------------------------
심마니
[강좌내용문의]
=-=-=-=-=-* Lee,Kyoung (solbawoo) 이경 (솔바우) 李炅 (松巖) *-=-=-=-=-=
*솔아로미* *정보서비스* Phone: +82-331-253-9009 +82-331-48-6804
산업정보,화학정보,무역정보 zipcode: 440-302
검색-번역-가공-출판기획 Address: 30-23,Jung-Ja 2dong,Jang-An ku
SOL Aromi Information Services Suwon,Kyung-Ki do,KOREA
Industry,Chemistry,Trading Informatons
mailto:leesun2@soback.kornet.nm.kr mailto:leesun2@usa.net
=-=-=-=-=-=-=-=-* http://soback.kornet.nm.kr/~leesun2 *-=-=-=-=-=-=-=-=
제목에 "솔"자를 넣으면 긴급시에 편리합니다.
Please type "sol" in subject line to send me.
'내발자국[동호회]' 카테고리의 다른 글
[답변/4358] DNS 에러 (0) | 1997.03.04 |
---|---|
[답변/4359] WS_FTP 에러 (프록시모드) (0) | 1997.03.04 |
[자] 작은 사업의 출발 [축] (0) | 1997.03.03 |
[경] 창립 1주년 IUG [축] (0) | 1997.03.03 |
[질문] 화장품용기,카툰 디자인 사이트 (0) | 1997.03.01 |