무료 표절 검사기를 발견하다

문서들이 서로 일치하는지 확인하는 검사해야 하는 경우가 가끔 있는데요. 예를들면, 레포트를 검사한다거나 할때 말이죠. 괜찮은 무료 S/W를 알게되어 소개합니다. 고맙게도 개발자가 소스코드까지 공개해 주었습니다.

프로그램 공식 홈페이지 : https://plagiarism.bloomfieldmedia.com/software/wcopyfind/

다운로드 경로 : https://plagiarism.bloomfieldmedia.com/WCopyfind64.4.1.5.exe.zip

출력 결과

아래와 같이 Html로 일치율을 보여줍니다. View Both File을 클릭하면 일치하는 구문을 상세히 확인할 수 있어요.

프로그램 설명

* 홈페이지에서 가져온 내용입니다.

WCopyfind는 문서와 단어의 유사점을 단어와 구문으로 비교하는 오픈 소스 창 기반 프로그램입니다. 무료이며 누구나 이용할 수 있습니다. 이 라이센스는 Gnu Public License에 따라 라이센스가 부여되며 기본적으로 다른 사람에게 판매하는 것을 제외하고는 원하는대로 할 수 있습니다.

대부분의 최신 소프트웨어 패키지와 달리 WCopyfind는 단일 실행 파일입니다. 설치하지 않고 실행하기 만하면됩니다.

목적:

WCopyfind는 텍스트 또는 워드 프로세서 문서를 서로 비교하여 이들이 문구로 단어를 공유하는지 확인합니다.

WCopyfind는 .DOCX, .TXT 및 .HTML 파일을 기본적으로 읽으며 순수한 이미지 내용이 아닌 텍스트 내용을 포함하는 한 .PDF 파일을 읽는 데 매우 효과적입니다. WCopyfind는 .DOC 파일에서 테스트를 추출 할 수 있지만 정교하거나 복잡하지는 않습니다.

개요 :

문서를 찾아 보거나 Windows 탐색기에서 WCopyfind로 끌어 문서를 선택하십시오.
비교 파라미터를 조정하십시오.
모든 보고서 파일을 저장할 폴더를 선택하거나 만듭니다.
비교 프로세스를 실행하십시오.
결과를 조사하십시오.

단계별 지침 :

1 단계 : WCopyfind를 시작하십시오.

WCopyfind.4.1.1.exe (또는 64 비트
컴퓨터의 경우 WCopyfind64.4.1.1.exe)를 다운로드하거나 찾은 다음 해당 아이콘을 클릭하십시오.

2 단계 : 비교할 문서 선택

두 가지 가능한 경로 :

이전 또는 새 문서 목록을 마우스 오른쪽 버튼으로 클릭하십시오.
팝업 메뉴에서 “문서 찾아보기”를 선택하십시오.
비교에 포함 할 문서를 검색하고 선택하십시오.
이 문서를 문서 목록에 추가하려면 “열기”를 누르십시오.
필요에 따라 1-4를 반복하십시오. [참고 : 1, 2 단계는 목록을 두 번 클릭하여 완료 할 수 있습니다.]

또는:

Windows 탐색기를 시작하십시오.
탐색기에서 비교할 하나 이상의 문서를 선택하십시오. 웹 상주 문서에 대한 설명은 참고 를 참조하십시오 .
해당 문서를 WCopyfind의 문서 창으로 끌어다 놓습니다.
필요에 따라 2 & 3을 반복하십시오.

[추가 기능 : 팝업 메뉴를 통해 특정 문서 목록을 저장하거나로드 할 수 있습니다 (목록을 마우스 오른쪽 버튼으로 클릭). 팝업 메뉴를 통해 목록에서 선택한 문서 또는 모든 문서를 삭제하거나“삭제”를 눌러 선택한 문서를 삭제할 수 있습니다. 팝업 메뉴에서 목록에있는 문서의 자동 정렬을 해제 할 수 있습니다.]

3 단계 : 비교 규칙 매개 변수 조정

일치하는 가장 짧은 구문 — 범위 : 1 ~ 무한 이 숫자는 WCopyfind가 일치하는 것으로 간주하는 최소 문자열 길이입니다. 예를 들어,이 매개 변수가 6으로 설정되면 WCopyfind는 길이가 5 단어 이하인 일치하는 구문을 무시합니다. 이 매개 변수를 6 (워드)으로 두는 것이 좋습니다.
Fewest Matches to Report — 범위 : 1 ~ 무한 이 숫자는 한 쌍의 문서에서 일치하는 단어 수가 가장 적으므로 WCopyfind가 “문서 비교”창에서 문서 일치를보고하고 보고서 파일에서 밑줄 친 비교 문서 쌍을 생성합니다. 폴더. 이 매개 변수에 권장되는 값은 없습니다.
허용 할 수있는 대부분의 결함 — 범위 : 0-9 이 숫자는 WCopyfind가 구문의 완벽하게 일치하는 부분 사이에서 허용하는 최대 비 일치 수입니다. 예를 들어이 값을 2로 설정하면 WCopyfind는 일치하지 않는 단어 두 개를 연결하여 완벽하게 일치하는 산문 조각을 연결합니다. 값이 0이면 WCopyfind가 완전 일치 항목 만 찾도록 제한하는 반면 1에서 9까지의 값은 WCopyfind가 불완전하게 일치하는 구 (결함이 포함 된 일치)를 찾을 수 있도록합니다. 이 값을 늘리면 프로그램 속도가 느려집니다. 값을 0 (속도 또는 절대 일치가 주요 요구 사항 인 경우) 또는 2 (작은 편집에도 불구하고 일치하는 항목을 찾으려면)를 권장합니다.
일치하는 단어의 최소 % — 범위 : 0-100 이 숫자는 구가 포함하고 일치하는 것으로 간주되는 완전 일치의 최소 백분율입니다. 이 값을 100으로 설정하면 WCopyfind가 완벽한 일치 항목 만 찾도록 제한합니다. 100 (속도 또는 절대 일치가 주요 요구 사항 인 경우) 또는 80 (작은 편집에도 불구하고 일치하는 항목을 찾으려면)을 권장합니다.
모든 문장 부호 무시 — 확인 : 예 또는 아니요이 옵션을 선택하면 비교할 때 WCopyfind에서 모든 문장 부호 문자를 무시합니다. 문장 부호는 WCopyfind가 생성하는 보고서에 계속 표시되지만 구문 일치에는 영향을 미치지 않습니다. 구두점을 무시하면 일반적으로 일치하는 항목이 증가합니다. 모든 구두점을 무시하고 싶지 않으면이 확인란을 선택하지 않는 것이 좋습니다.
외부 구두점 무시 — 확인 : 예 또는 아니요이 옵션을 선택하면 WCopyfind가 단어를 비교할 때 단어의 왼쪽이나 오른쪽에 나타나는 구두점 문자를 무시합니다. 예를 들어, 인용 된 문장 :“내가 찾은 상자가 깨졌습니다.” 내가 찾은 상자가 끊어졌습니다 (마지막 기간 없음). 이“외부 구두점”은 WCopyfind가 생성 한 보고서에 계속 표시되지만 구문 일치에는 영향을 미치지 않습니다. 외부 구두점을 무시하면 일반적으로 일치하는 항목이 증가합니다. 절대 일치를 원하면이 확인란을 선택하지 말고 약간의 편집에도 불구하고 일치하는 항목을 찾으려면이 확인란을 선택하는 것이 좋습니다.
숫자 무시 — 검사 됨 : 예 또는 아니요이 옵션을 선택하면 비교를 수행 할 때 WCopyfind가 숫자 문자를 무시합니다. 예를 들어이 매개 변수를 선택하면 단어 8 배와 10 배가 일치합니다. WCopyfind가 생성하는 보고서에는 숫자가 계속 표시되지만 구문 일치에는 영향을 미치지 않습니다. 숫자가 무시되면 일반적으로 일치가 증가합니다. 절대 일치를 원하면이 확인란을 선택하지 말고 약간의 편집에도 불구하고 일치하는 항목을 찾으려면이 확인란을 선택하는 것이 좋습니다.
문자 대소 문자 무시 — 검사 됨 : 예 또는 아니요이 옵션을 선택하면 WCopyfind에서 문자를 비교할 때 대문자를 무시합니다. 예를 들어,이 매개 변수를 선택하면 언제, 언제든 일치합니다. WCopyfind가 생성하는 보고서에는 대문자가 계속 표시되지만 구문 일치에는 영향을 미치지 않습니다. 대소 문자를 무시하면 일반적으로 일치하는 항목이 증가합니다. 절대 일치를 원하면이 확인란을 선택하지 말고 약간의 편집에도 불구하고 일치하는 항목을 찾으려면이 확인란을 선택하는 것이 좋습니다.
비 단어 건너 뛰기 — 확인 : 예 또는 아니요이 옵션을 선택하면 WCopyfind가 내부 하이픈과 아포스트로피를 제외하고 문자 이외의 문자를 포함하는 단어를 완전히 건너 뜁니다. 비 단어는 일치에 사용되지 않으며 WCopyfind가 생성 한 보고서에 나타나지 않습니다. 이 확인란을 선택하면 구두점으로 시작하거나 끝나는 단어를 건너 뛰지 않도록 (여러 소유를 포함하여) ‘외부 구두점 무시’도 확인하는 것이 좋습니다. 절대 일치를 원하면이 확인란을 선택하지 말 것을 권장하지만 비교하는 문서에 파일 이름, URL 및 기타 워드 프로세서 정크를 포함하여 텍스트가 아닌 많은 항목이 포함되어 있으면이 확인란을 선택하는 것이 좋습니다.
_____ 자보다 긴 단어 건너 뛰기 — 선택 : 예 또는 아니요, 범위 : 0-255 이 옵션을 선택하면 WCopyfind가 선택한 문자 수보다 긴 단어를 완전히 건너 뜁니다. 너무 긴 단어는 일치에 사용되지 않으며 WCopyfind가 생성 한 보고서에 나타나지 않습니다. 문서에 실제로 단어보다 긴 단어가 포함되어 있지 않으면이 확인란을 선택하고 문자 수를 20으로 설정하는 것이 좋습니다. 이 선택을 통해 WCopyfind는 파일 이름, URL, 이미지 데이터 및 기타 워드 프로세서 정크를 포함한 많은 비 텍스트 항목을 건너 뛸 수 있습니다.
기본 문자 만 (DOC 파일) — 확인 : 예 또는 아니요이 옵션을 선택하면 WCopyfind가 .DOC 파일 (구식 Microsoft Word 형식)을 읽을 때 인식하는 문자 세트를 제한합니다. 그런 다음 WCopyfind는 해당 기본 콜렉션 외부의 문자를 비 인쇄 문자로 간주하고 일치하는 프로세스에 포함시키지 않습니다. 영어 이외의 문자가 비교적 적은 .DOC 파일을 비교하려면이 옵션을 선택하는 것이 좋습니다.
언어 가장 적합한 언어를 선택하면 WCopyfind가 문자, 문장 부호 또는 대문자 인 문자를 결정하는 데 도움이됩니다.

4 단계 :보고 폴더 및 스타일 선택

보고 폴더를 찾거나 작성하려면 찾아보십시오. 비교를 실행하기 전에 존재해야합니다.
비교 파일에 일치하는 문구 만 포함 시키려면“간단한 보고서”상자를 선택하십시오 ( 참고 참조 ).

5 단계 : 비교 실행 및 결과 검사

“실행”을 클릭하십시오-비교가 비교 창에보고됩니다. ( 비교 선에 대한 설명은 참고 를 참조하십시오 .)
비교 프로세스가 실행되는 동안 작은 창이 열리므로 프로세스가 완료되기 전에 중단 할 수 있습니다.
프로세스가 끝나면 브라우저 창이 열리고 일치하는 파일 쌍을 검사 할 수 있습니다. 인쇄하기 쉽도록 파일을 개별적으로 클릭하거나 “나란히”옵션을 클릭하여 파일 쌍을 새 브라우저 창의 인접한 패널에 함께 표시 할 수 있습니다.
파일을 나란히 볼 때 일치하는 모든 구가 두 파일간에 활발하게 연결됩니다. 왼쪽 파일 패널에서 일치하는 문구를 클릭하면 오른쪽 파일의 해당 문구가 오른쪽 패널의 맨 위로 이동하고 그 반대도 마찬가지입니다.
WCopyfind의 내부 보고서 창에서 비교 행을 두 번 클릭하여 인터넷 브라우저에서 두 개의 비교 (.html 파일로 저장)를 검사 할 수도 있습니다.

[추가 기능 : 팝업 메뉴를 통해 보고서 목록을 파일로 저장할 수 있습니다 (보고서 목록을 마우스 오른쪽 버튼으로 클릭). 팝업 메뉴를 통해 목록에서 선택한 줄 또는 모든 줄을 삭제하거나“삭제”를 눌러 선택한 줄을 삭제할 수 있습니다. C 부분에서 설명한 브라우저 창을 다시 열 수도 있습니다.]

파일 형식에 대한 참고 사항

WCopyfind는 .docx 파일의 압축을 풀고 분석하는 방법을 알고 있습니다. zlib 를 사용 하여 열려있는 각 문서 형식 파일을 압축 해제 한 다음 포함 된 document.xml 파일을 읽고 디코딩합니다. 전체 유니 코드 문자 집합을 처리하며 단어 사이에 공백이나 문장 부호를 넣는 대부분의 언어에서 작동합니다.
WCopyfind는 .html (및 .htm ) 파일 을 읽는 방법을 알고 있습니다. UTF-8 문자가있을 때이를 인식하므로 많은 언어를 처리 할 수 있어야합니다.
WCopyfind는 .pdf 파일 을 열고 분석하는 방법을 알고 있지만 복잡한 문자를 처리하지 않으며 항상 단어를 올바르게 나누지는 않습니다. 그러나 Foolabs 의 pdftotext 실행 파일을 WCopyfind.3.0 실행 파일과 같은 폴더에 배치하면 WCopyfind는 .pdf 파일을 열 때마다 pdftotext를 사용합니다. Pdftotext는 훨씬 더 정교하며 .pdf 파일을 놀랍도록 잘 읽습니다. pdftotext는 Gnu Public License가 적용되는 오픈 소스 프로그램이므로 여기에 pdftotext.exe 사본을 포함 시킵니다. Foolabs의 사람들이 신경 쓰지 않기를 바랍니다. 중요 참고 사항 : .pdf 파일에는 때때로 이미지가 포함됩니다실제 텍스트가 아닌 텍스트 이러한 이미지는 다양한 .pdf 뷰어 에서 볼 수 있지만 WCopyfind에서 읽을 실제 텍스트는 없습니다. 이러한 이미지 텍스트로 작업하려면 .pdf 문서 에서 OCR (광학 문자 인식)을 사용한 다음 텍스트로 저장해야합니다. Adobe Acrobat은 이런 종류의 작업을 수행 할 수 있습니다.
WCopyfind는 .doc 파일을 탐색하여 텍스트를 찾을 수 있지만 이미지 이름 및 형식 지침과 같은 내부 파일 정보도 찾을 수 있습니다. 너무 많은 다른 형식의 .doc 파일이 있으며 정확하게 분석하는 방법을 배우는 것은 너무 어렵습니다. WCopyfind는 가능한 모든 것을 읽기 위해 최선을 다할 것입니다.
WCopyfind 는 매우 간단하기 때문에 .txt 파일을 잘 읽을 수 있습니다 . 는 IF 가 .txt 파일에 BOM (바이트 순서 표시)로 시작 WCopyfind는 UTF-8 문자 집합을 사용하는 .txt 인 파일을 가정하고 많은 언어를 처리합니다. BOM이 없으면 표준 8 비트 Windows 문자 세트를 가정합니다.
WCopyfind는 다른 파일 형식을 읽을 수 있지만 정교하지는 않습니다. 단순히 표준 8 비트 Windows 문자 세트를 가정하고 파일에서 텍스트를 찾으려고 시도합니다.