Mô tả: WordSmith Tools được xuất bản bởi Lexical Analysis Software và Oxford University Press từ năm 1996, là một bộ chương trình tích hợp để xem cách các từ hoạt động trong văn bản. Bạn sẽ có thể sử dụng các công cụ trong WordSmith Tools để tìm hiểu cách các từ được sử dụng trong văn bản thuộc hầu hết các ngôn ngữ bao gồm tiếng Trung, tiếng Nhật, v.v.của chính bạn hoặc của người khác. Các công cụ trong WordSmith Tools đã được Nhà xuất bản Đại học Oxford sử dụng cho công việc từ điển của riêng họ trong việc chuẩn bị từ điển, bởi các sinh viên, giáo viên, nhà nghiên cứu và điều tra viên làm việc trong các lĩnh vực như ngôn ngữ học, văn học, luật, y học, lịch sử, chính trị, xã hội học…thuộc nhiều lĩnh vực khác nhau ở nhiều quốc gia trên toàn thế giới.
Màn hình chính của WordSmith Tools Controller gồm có ba nút cho công cụ chính và một loạt tab để điều chỉnh cài đặt.
Auto-create word list:
Collocation follow-up involving relationship stats:
Text break visibility in Concord:
Key word type/token coverage:
Key word dispersion difference:
Save list of tags found:
Multi-word unit conversion:
Plot contexts:
Concord files processed list (automatic or manual):
Add a Set column:
Export KeyWords database data:
TED talks video conversion:
Enhanced key word statistics and key word display:
Part of speech tag filtering:
Multiple statistics in collocation display:
Dispersion statistic for word lists:
Lemma file building:
Mis-matched tag finder:
Boilerplate text finding:
Duplicate and near-duplicate text file finding:
Relevance filter:
Highlighter:
BIC scores for key items:
Corpus sampler:
Choice for percentage columns:
Improved colours:
High definition screen focus:
Text Converter case change:
Text Converter remove words:
Relative entropy:
Associates follow-up:
Chargram patterns:
Part of speech renaming:
Conditional Probability statistics:
Build sub-corpora:
Clusters in single-word word list:
TMX file handling:
Copy search-word to Set column:
File count facility:
RTF Sample:
Normalised counts:
Text dispersion keyness:
Move files to sub-folders:
Skins:
Word Clouds:
Date handling & Time-lines:
.docx files:
Scripting:
Colour categories:
Phrase frames:
Collocate following:
Chargrams:
Tự động tạo danh sách từ
Theo dõi sắp xếp thứ tự liên quan đến thống kê mối quan hệ
Khả năng hiển thị ngắt văn bản trong Concord
Loại từ khóa/độ bao phủ mã thông báo
Sự khác biệt về phân tán từ khóa
Lưu danh sách các thẻ được tìm thấy
Chuyển đổi đơn vị nhiều từ
cốt truyện bối cảnh
Danh sách xử lý tệp Concord (tự động hoặc thủ công)
Thêm cột tập hợp từ “Set”
Xuất dữ liệu cơ sở dữ liệu từ khóa
Bộ chuyển đổi video nói chuyển TED
Thống kê từ khóa nâng cao và hiển thị từ khóa
Một phần của lọc thẻ lời nói
Nhiều số liệu thống kê trong màn hình sắp xếp thứ tự
Thống kê phân tán cho danh sách từ
Xây dựng tập tin bổ đề
Công cụ tìm thẻ không khớp
Tìm kiếm văn bản soạn sẵn
Tìm tệp văn bản trùng lặp và gần trùng lặp
Bộ lọc liên quan
Bút đánh dấu
Điểm BIC cho các hạng mục chính
Mộ lấy mẫu Corpus
Lựa chọn cho các cột tỷ lệ phần trăm
Cải thiện màu sắc
Tiêu điểm màn hình độ nét cao
Thay đổi trường hợp chuyển đổi văn bản
Chuyển đổi văn bản loại bỏ các từ
Entropi tương đối
Theo dõi cộng sự
Mẫu biểu đồ ký tự
Một phần của bài phát biểu đổi tên
Thống kê xác suất có điều kiện
Xây dựng tiểu tập đoàn
Các cụm trong danh sách từ đơn
Xử lý tệp TMX
Sao chép từ tìm kiếm vào cột Set
Tiện ích đếm tập tin
Mẫu RTF
Số lượng chuẩn hóa
Keyness phân tán văn bản
Di chuyển tệp vào thư mục con
Tùy chọn giao diện
Đám mây từ
Xử lý ngày & Dòng thời gian
Tệp .docx
Viết Tập lệnh
Danh mục màu
Khung cụm từ
Sắp xếp theo sau
Biểu đồ ký tự Char
Concord là một chương trình tạo sự phù hợp bằng cách sử dụng các tệp văn bản web hoặc văn bản thuần túy.
Để sử dụng nó, bạn sẽ chỉ định một từ hoặc cụm từ tìm kiếm mà Concord sẽ tìm kiếm trong tất cả các tệp văn bản bạn đã chọn. Sau đó, nó sẽ hiển thị một màn hình phù hợp và cung cấp cho bạn quyền truy cập vào thông tin về các cụm từ tìm kiếm, biểu đồ phân tán hiển thị vị trí của từ tìm kiếm trong mỗi tệp, phân tích cụm hiển thị các cụm từ (cụm từ) lặp lại, v.v.
Điểm của nó…
Điểm của sự phù hợp là có thể xem nhiều ví dụ về một từ hoặc cụm từ, trong ngữ cảnh của chúng. Bạn hiểu rõ hơn về cách sử dụng một từ bằng cách xem nhiều ví dụ về từ đó, và chính bằng cách nhìn hoặc nghe những từ mới trong ngữ cảnh nhiều lần mà bạn nắm bắt được ý nghĩa của hầu hết các từ trong ngôn ngữ mẹ đẻ của mình. Bằng cách xem ngữ cảnh, bạn sẽ hiểu rõ hơn về cách sử dụng từ mới. Từ điển có thể cho bạn biết nghĩa nhưng nó không tốt lắm trong việc chỉ cho bạn cách sử dụng từ đó.
Sinh viên ngôn ngữ có thể sử dụng công cụ đối âm để tìm hiểu cách sử dụng một từ hoặc cụm từ hoặc để tìm ra những từ khác thuộc về từ mà họ muốn sử dụng. Ví dụ: thông qua việc sử dụng công cụ đối chiếu mà bạn có thể phát hiện ra rằng trong bài viết học thuật, một bài báo có thể mô tả, khẳng định hoặc thể hiện, mặc dù nó không tin hoặc không muốn (*bài báo này muốn chứng minh điều đó ...).
Giáo viên ngôn ngữ có thể sử dụng máy đối chiếu để tìm các mẫu tương tự để giúp học sinh của họ. Họ cũng có thể sử dụng Concord để giúp tạo các bài tập từ vựng, bằng cách chọn hai hoặc ba từ tìm kiếm, bỏ trống chúng, sau đó in ra.
Các nhà nghiên cứu có thể sử dụng công cụ đối chiếu, chẳng hạn như khi tìm kiếm thông qua cơ sở dữ liệu về hồ sơ tai nạn bệnh viện, để xem liệu gãy xương có liên quan đến ngã, dầu mỡ, thang hay không. Hoặc kiểm tra các tài liệu lịch sử để tìm tất cả các tài liệu tham khảo về quyền sở hữu đất đai.
Một sự phù hợp concord trông giống như thế này:
Đây là sự phù hợp của tất cả các sự kiện xảy ra của việc từ wherefore trong Romeo và Juliet. Chỉ có 5 lần dùng từ wherefore.
Mục đích của chương trình này là định vị và xác định các từ khóa trong một văn bản nhất định. Để làm như vậy, nó so sánh các từ trong văn bản với một tập hợp các từ tham chiếu thường được lấy từ một kho văn bản lớn. Bất kỳ từ nào được coi là nổi bật về tần suất của nó trong văn bản đều được coi là "chìa khóa". Các từ khóa được trình bày theo thứ tự nổi bật.
Sự phân bố của các từ khóa có thể được vẽ thành biểu đồ.
Các danh sách có thể được lưu để sử dụng sau này, chỉnh sửa, in, sao chép vào trình xử lý văn bản của bạn hoặc lưu dưới dạng tệp văn bản.
Chương trình này cần quyền truy cập vào 2 danh sách từ trở lên, danh sách này phải được tạo trước bằng chương trình danh sách từ - Word List.
Danh sách từ khóa Key Words List trong Công cụ WordSmith trông giống như thế này.
Từ khóa là những từ xuất hiện thường xuyên một cách bất thường so với một số loại ngữ liệu tham khảo.
Bên cạnh mỗi từ khóa có nhiều con số khác nhau cho bạn biết mức độ thường xuyên của từng từ khóa trong (các) văn bản nguồn và so sánh từ đó với tần suất xuất hiện của nó trong kho văn bản tham khảo.
Trong danh sách trên, dựa trên vở kịch Romeo và Juliet so với tất cả các vở kịch của Shakespeare, chúng ta thấy rất nhiều tên của các nhân vật chính, một số đại từ như ngươi, cộng với các từ chủ đề như tình yêu và đêm.
WordList tạo danh sách từ dựa trên một hoặc nhiều tệp văn bản thuần túy hoặc văn bản web. Danh sách từ được hiển thị cả theo thứ tự bảng chữ cái và tần suất. Chúng có thể được lưu để sử dụng sau này, chỉnh sửa, in, sao chép vào trình xử lý văn bản của bạn hoặc lưu dưới dạng tệp văn bản.
Danh sách từ Word List trong WordSmith Tools trông giống như sau:
Nó cho biết tần suất xuất hiện của mỗi từ trong tệp văn bản, tỷ lệ phần trăm của các từ đang chạy trong văn bản và số lượng tệp văn bản mà mỗi từ được tìm thấy.
Mua mới (giá nêu ở đây chưa bao gồm VAT).
Giấy phép Site Licence cho tối đa 10 người dùng (được cài đặt trong một tổ chức, có sẵn cho tối đa 10)
Giấy phép Site Licence cho tối đa 50 người dùng (được cài đặt trên mạng và có sẵn tối đa 50)
Giấy phép Site Licence cho tối đa 100 người dùng (được cài đặt trên mạng và có sẵn cho tối đa 100)
Giấy phép Site Licence cho tối đa 200 người dùng (được cài đặt trên mạng và có sẵn cho tối đa 200)
Đào tạo cho tối đa 12 người
Nguồn: https://lexically.net/