原文地址https://blog.csdn.net/p_jinsan/article/details/96152078
稍作了一些補充
1.環(huán)境
windows10->虛擬機->Ubuntu 16.04 64位
2.前置條件
2.1更新apt
sudo apt upgrade
sudo apt update
2.2安裝git
sudo apt install git
2.3安裝apache2
sudo apt install apache2
檢測:瀏覽器中輸入http://127.0.0.1/或者http://localhost/
進入下圖界面,則說明安裝成功
?
2.4安裝google chrome#個人習慣
wget https://dl.google.com/linux/direct/google-chrome-stable_current_amd64.deb sudo dpkg -i google-chrome-stable_current_amd64.deb
3.安裝
3.1下載brat
進入主頁下載 http://brat.nlplab.org/index.html
?
補充:點擊Download,像我就出現(xiàn)了無法連接的情況,可以將下載地址復制到迅雷進行下載
http://weaver.nlplab.org/~brat/releases/brat-v1.3_Crunchy_Frog.tar.gz
?
?
?
3.2解壓
tar xzf 路徑/文件名
eg: tar xzf Downloads/brat-v1.3_Crunchy_Frog.tar.gz
3.3進入文件夾
重命名為brat
cd brat
3.4安裝,配置一些用戶信息
./install.sh
3.5打開#每次使用都需要
python2 standalone.py
3.6打開瀏覽器進入即可開始標注
http://127.0.0.1:8001/index.xhtml
4.使用
4.1登錄后,選中文本后會彈出窗口,選擇實體類型
4.2拖動標注好的實體可以連接關系
4.3雙擊標簽可對標簽進行修改或刪除
4.4點擊data可導出標注好的數(shù)據(jù)
ps:未登錄不能進行標注
?
?
?
?
5.配置
annotation.conf
1.entities用來定義標注的實體名稱,其格式為每行一個實體類型, 比如:人名、地名、英雄名、技能名等,可以采用tab來增加二級標注, hero hero1 2.relations用來定義實體間的關系,格式為每行定義一種關系,第一列為關系類型, 隨后是用逗號分隔的ArgNrelations用來定義實體間的關系,格式為每行定義一種關系,第一列為關系類型, 隨后是用逗號分隔的ArgN:實體名,用來表示關系的各個相關者。 relation1 Arg1:hero1, Arg2:hero1 3.events用來定義事件,每行定義一類事件,第一列為事件名,隨后是用逗號分隔的Participant:實體名, 用來表示事件的各個參與者。 4.attributes用來定義屬性,每行一個屬性,第一列為屬性名,隨后是用逗號分隔的Arg:<模塊類型>, Value:屬性值, 注意屬性值可以有多個
?
?visual.conf#視覺配置文件
1.采用中文標簽時需要 2.將annotation.conf中名稱替換 3.labels [labels] hero1 | 魏
?
?6.其他
6.1中文支持
添加
n = re.sub(u'[^a-zA-Zu4e00-u9fa5<>,0-9_-]', '_', n)
到./server/src/projectconfig.py第163行
?
6.2給.txt文件添加.ann的標引文件
find 文件夾名稱 -name '*.txt'|sed -e 's|.txt|.ann|g'|xargs touch eg:find data/exa -name '*.txt'|sed -e 's|.txt|.ann|g'|xargs touch
給文件夾內(nèi)所有.txt文件添加對應的.ann標引文件
6.3添加用戶(本地不需要)
直接在config.py文件中添加
USER_PASSWORD = { 'admn': 'admin', 'test': 'test', #'user':'password', # (add USERNAME:PASSWORD pairs below this line.) }
7.參考
本文摘自 :https://www.cnblogs.com/