|
안녕하세요, 김도훈이라고 합니다.
제가 프로그램을 짤려고 하는데, 목적은 html, xml 문서를 읽어들여서 원하는 스트링만 추출한 뒤, DB에 저장하는 프로그램을 짤려고 합니다.
사실 학교에서 쉬운 프로그램만, 생각해야 하는 프로그램만 구현을 하다가 막상 여러가지 skill이 필요하니깐, 무엇을 알아야 하는지도 잘 모르겠군요.
제 생각에는 문서를 읽어들여 텍스트 파일로 저장한 뒤, 파일에서 스트링을 처리하는 프로그램을 짜서 DB에 저장하면 되지 않을까, 하거든요(실 문서를 읽어들이는 법도 모르고, DB에 저장하는 법도 모릅니다. 책 보고 공부해야지요).
제가 무엇을 알아야 하는지에 대해 조언 부탁드립니다.
웬만하면 C++상에서 구현할려고 하구요, vc++과 같은 툴은 사용하지 않으려고 하거든요.
하지만 무엇이든 좋으니, 조언 기다리겠습니다.
그리고 친구가 문서를 파싱해야 한다고 하는데, 꼭 파싱을 해야 하는지도 알려주십시요, 하면 편하단건지 아니면 꼭 해야 하는지...
|