研究者業績

江藤 正己

エトウ マサキ  (Masaki Eto)

基本情報

所属
学習院女子大学 国際文化交流学部 国際コミュニケーション学科 准教授
学位
修士(図書館・情報学)(慶應義塾大学)

研究者番号
10584807
ORCID ID
 https://orcid.org/0000-0003-2029-6745
J-GLOBAL ID
201601016494969359
researchmap会員ID
B000263221

研究キーワード

 2

論文

 9

MISC

 35
  • 松本直樹, 江藤正己, 須賀千絵, 池谷のぞみ
    日本図書館情報学会研究大会発表論文集 37-40 2024年9月  
  • 松本直樹, 須賀千絵, 江藤正己, 池谷のぞみ
    日本図書館情報学会研究大会発表論文集 65-66 2023年10月  
  • 安形輝, 江藤正己, 杉江典子, 橋詰秋子, 安形麻理, 大谷康晴
    日本図書館情報学会春季研究集会発表論文集 47-50 2023年6月  
  • 安形輝, 江藤正己, 杉江典子, 橋詰秋子, 安形麻理, 大谷康晴
    日本図書館情報学会研究大会発表論文集 79-80 2022年10月  
  • 安形輝, 大谷康晴, 江藤正己, 杉江典子, 安形麻理, 橋詰秋子
    日本図書館情報学会研究大会発表論文集 63-64 2021年10月  
  • 安形輝, 江藤正己, 杉江典子, 橋詰秋子, 大谷康晴
    日本図書館情報学会春季研究集会発表論文集 29-32 2020年6月  
  • 大谷 康晴, 安形 麻理, 橋詰 秋子, 安形 輝, 杉江 典子, 江藤 正己
    三田図書館・情報学会研究大会発表論文集 1-4 2019年11月  
  • Yasuharu Otani, Teru Agata, Akiko Hashizume, Masaki Eto, Mari Agata, Noriko Sugie
    Proceedings of ACM/IEEE Joint Conference on Digital Libraries, Urbana-Champaign, Illinois, June 422-423 2019年6月  査読有り
  • Masaki Eto
    METRICS 2018: Workshop on Informetric and Scientometric Research (SIG/MET) 2018年11月  
  • 大谷康晴, 安形輝, 橋詰秋子, 江藤正己, 安形麻理, 杉江典子
    日本図書館情報学会研究大会発表論文集 115-116 2018年11月  
  • Masaki Eto
    Proceedings of the 18th ACM/IEEE on Joint Conference on Digital Libraries, JCDL 2018, Fort Worth, TX, USA, June 03-07, 2018 329-330 2018年  査読有り
  • Masaki Eto
    METRICS 2017: Workshop on Informetric and Scientometric Research (SIG/MET) 2017年10月  
  • 江藤正己, 安形輝, 杉江典子, 大谷康晴, 安形麻理, 橋詰秋子
    三田図書館・情報学会研究大会発表論文集 37-40 2017年10月  
  • Masaki Eto, Teru Agata, Noriko Sugie, Yasuharu Otani, Mari Agata
    Proceedings of the ACM/IEEE Joint Conference on Digital Libraries 287-288 2017年7月25日  査読有り
    This study addressed the automatic classification of Japanese manga held by public libraries. Holdings of 4,681 public libraries and similar facilities were investigated, and 29,795 manga titles were identified. Hierarchical clustering was applied to 631 titles that were each held by more than one hundred libraries. Five clusters were identified in the upper hierarchy. Principal coordinate analysis and a manual examination of individual titles were performed to identify the common characteristics of the works in each cluster. The results suggest that the proposed method offers a novel approach to large-scale classification of manga titles.
  • 安形輝, 杉江典子, 安形麻理, 江藤正己, 大谷康晴, 橋詰秋子
    三田図書館・情報学会研究大会発表論文集 25-28 2016年10月  
  • Masaki Eto
    Proceedings of the Association for Information Science and Technology 53(1) 1-4 2016年  査読有り
    This paper proposes a “rough co-citation”, which is a measure of relationship to expand co-citation networks so as to include new relevant documents. A rough co-citation relationship is a linkage between a pair of documents which are cited by two other documents in a similar citation context. The linkage strength of a rough co-citation relationship may be weaker than the original co-citation relationship, because a rough co-citation relationship is determined by citations in two separate documents. Rough co-citation linkages, however, may yield new relevant documents that are not identified by the original co-citation linkages. For example, the rough co-citation can identify relevant documents that are published after the citing document of the original co-citation becomes public. This study conducted IR experiments to evaluate the search performances of retrieval methods using the co-citation networks expanded by the rough co-citation relationships. Specifically, the random walk with restart, which is one of the latest graph search algorithms, is applied to the expanded and original co-citation networks. Scores of the normalized discounted cumulative gain (nDCG@K) are then compared. The results indicate that the search performance of the method using the expanded network outperforms a baseline method using the original network.
  • Masaki Eto
    Proceedings of the Joint Workshop on Bibliometric-enhanced Information Retrieval and Natural Language Processing for Digital Libraries (BIRNDL) co-located with the Joint Conference on Digital Libraries 2016 (JCDL 2016), Newark, NJ, USA, June 23, 2016. 30-35 2016年  査読有り
  • Masaki Eto
    Proceedings of the ACM/IEEE Joint Conference on Digital Libraries 2015- 245-246 2015年6月21日  査読有り
    In the field of academic document search, citations are often used for measuring implicit relationships between documents. Recently, some studies have attempted to extend co-citation searching. However, these studies mainly focus on comparisons of traditional co-citation and extended co-citation search methods combination effects of word-based and extended co-citation search algorithms have not yet been sufficiently evaluated. This paper empirically evaluates the search performance of the combination search by using a test collection comprising about 152,000 documents and a metric 'precision at k.' The experimental results indicate that the combination search outperforms two baseline methods: a word-based search and a combination search of word-based and traditional co-citation search algorithms.
  • Masaki Eto
    Proceedings of the ASIST Annual Meeting 51(1) 2014年  査読有り
    This paper proposes a graph-based retrieval technique on a weighted co-citation network, which allows users to find more relevant documents easily from the co-citation network. More specifically, the random walk with restart technique is applied to a weighted graph of documents, in which the degree of each edge weight is measured by the number of co-citation documents and the strength of the co-citation context both obtained by parsing the full text of the citing documents. To evaluate its effectiveness empirically, a special test collection was created from the Open Access Subset of PubMed Central, and the search performance of the proposed method was compared with traditional co-citation searching by "precision at k." The experimental results indicate that the proposed method tends to retrieve much more relevant documents without reducing precision.
  • Masaki Eto
    Poster Proceedings of the 8th ACM Conference on Recommender Systems, RecSys 2014, Foster City, Silicon Valley, CA, USA, October 6-10, 2014 2014年  査読有り
  • Masaki Eto
    International Conference on Information and Knowledge Management, Proceedings 7-8 2012年  査読有り
    This paper proposes a measure that uses a spread co-citation relationship for document retrieval. To clarify whether this proposed measure has potential for enhancing the search performance of co-citation searching, two retrieval methods are evaluated: one uses the relationship directly the other incorporates the co-citation context. Experiments with a special test collection comprising about 152,000 documents are conducted. Results indicate that this relationship tends to be able to detect relevant documents which are undetectable using a traditional co-citation relationship, and that using context has a positive effect to reduce the number of noise documents. © 2012 ACM.
  • 樋澤 光紀, 原田 隆史, 江藤 正己
    情報処理学会研究報告. DD, [デジタル・ドキュメント] 2009(35) 69-76 2009年3月18日  
    本研究の目的は,レファレンス事例の質問文と回答文を元にして,その事例に適切なキーワードを自動的に付与することである。これまでレファレンス事例中の語をキーワードとして抽出する実験は行われていたが,この方法では事例中に出現しない語はキーワードとして付与できないという欠点があった。そこで本研究では,ウェブ検索エンジンの検索結果リストに含まれるタイトルとスニペットを利用し,キーワードを自動的に付与する手法を提案する。具体的には(1)事例中の語からキーワードを機械学習手法により抽出し,(2)抽出したキーワードを検索語として検索エンジンからタイトルとスニペットを取得し,(3)その中に出現する語を対象として重要度計算によってキーワードを決定する,という手順でキーワードの自動付与を行った。日本史分野のレファレンス事例120件を使用して,付与実験を行った結果,キーワードの候補として10語を付与した時に精度31.4%、再現率61.4%で正しいキーワードを付与することができた。
  • 原田隆史, 大用愛子, 江藤正己
    日本図書館情報学会春季研究集会発表要綱 75-78 2009年  
  • 江藤正己
    情報処理学会研究報告情報学基礎(FI) 2008(105) 39-46 2008年10月30日  
    共引用関係を利用した文書検索手法は,共引用関係を 2 値的に扱うため,文書得点の算出が粗く,手法の発展性に限界がある.また,語に基づく検索では得られない適合文書を検索できる可能性が示唆されているものの,その検証はあまりなされていない.そこで,本稿では,文脈情報に基づき共引用関係を精密に扱う検索手法を提案し,テストコレクションによる検索実験から,提案手法の特徴の検証とその評価をおこなった.その結果,提案手法の特徴として, (1) 語に基づく検索では得られない適合文書を検索できること (2) 従来手法より検索結果の順位を適切に出力できること (3) 共引用回数が少ない適合文書を検索結果の上位に順位付られることが明らかになった.In this paper the author proposes a sophisticated document retrieval method using context based co-citation relationship. To evaluate the effectiveness of the proposed method, two experiments were conducted. The first experiment is to compare documents retrieved by word with the ones retrieved by co-citation relationship. The second one is to compare the proposed method with the traditional method by using binary co-citation relationship based on two typical metrics (MAP and nDCG), and by analyzing documents ranked top 10. The experiments showed that the proposed method will (1) retrieve relevant documents which cannot be retrieved by using word, (2) rank retrieved relevant documents more adequately, and (3) rank relevant documents highly, even though the number of the frequencies of their co-citation is few.
  • 原田 隆史, 江藤 正己, 高柳 知世
    情報知識学会誌 18(2) 153-160 2008年5月23日  
    近年,感性に基づいて小説を検索できるシステムが開発され実用化されてきている。著者らも児童書を対象としてオンライン書評から感性を示すパラメータに値を設定し,検索できるシステムを構築してきた。しかし,人間が付与するパラメータの値と書評中の語との関係の分析は十分に行われておらず,書評中の語を元として感性パラメータの値をどのように設定することが適切であるかは明らかとなっていない。本研究は,書評中の「人の感情や本の雰囲気を表す語」を元に機械学習の手法を用いて人間の判断と一致する感性パラメータの値を付与する実験を行ったものである。図書1605 冊分の書評を使って自動設定実験を行った結果,(1) 自動設定において書評中の語を使うことに有用性がある,(2) 書評中のすべての語を用いるよりも,出現回数が多い30語程度を用いた方が効果的である,(3)書評中から抽出する語の品詞はほとんど再現率に影響しないことなどを明らかにすることができた。
  • 原田 隆史, 江藤 正己, 瀬口 真徳
    情報処理学会研究報告. NL,自然言語処理研究会報告 184(33) 119-124 2008年3月27日  
    本研究の目的は,図書館におけるレファレンス記録の質問文および回答文から,そのレファレンス記録のキーワードとして適切な語句を自動的に抽出することである。自動抽出の手順は(1)候補となる語句を抽出し(2)キーワードとして適切か否かを判定するに大別できるが,本研究では(2)に焦点を当て,機械学習の手法を用いてこれを試みた。具体的には,キーワード候補となる語句の出現箇所,出現回数,語の前後の助詞など42個の特徴と人手に基づく正解判定の対を学習させ,自動判定をおこなった。日本史分野のレファレンス記録507件中の,人手によってキーワード判定を行った9,375語を対象とした実験の結果,精度56.9%,再現率48.3%でキーワードを正しく付与することができた。
  • 原田 隆史, 江藤 正己, 大西 美奈子
    情報知識学会誌 17(2) 61-64 2007年5月25日  
    本研究では,国立国会図書館(NDL)のレファレンス協同データベースに収録されたレファレンス記録に対するNDC の自動付与実験を行った。手法としては決定木法、ナイーブベイズ法,SVM(Support Vector Machine)法の3つの機械学習法を用いた。5703件のレファレンス記録中の質問文および回答文それぞれに含まれる単語を対象に学習させ,634件を対象に分類したところ,質問文を対象に手法としてはSVM法を用いた場合にわずかに正しく付与される傾向が見られた。ただし,再現率,精度ともに対象や手法による差はそれほど大きくなかった。また,分野カテゴリごとの再現率を調べたところ,分野によって再現率に大きな差があった。分野によっては60%を超える再現率で分類できる場合もあり,機械学習法でレファレンス記録にNDC を付与することが有効であることが明らかになった。
  • 江藤 正己
    情報知識学会誌 17(2) 65-68 2007年5月25日  
    従来の共引用では,一つの引用論文における被引用論文間の類似度は全て同じであることを前提としている.しかし,引用論文における引用箇所間の意味的な近さをとらえることで被引用論文間の類似性の強弱を推測できると考えられる.そこで,近さをとらえる尺度として,「物理的距離(文字数)」「(引用箇所の)周辺語間の類似度」「論文構成からみた距離」を設定し,尺度としての適切さを検討する.
  • 江藤 正己
    三田図書館・情報学会研究大会発表論文集 2007 17-20 2007年  
  • 江藤 正己
    ,電子情報通信学会第18 回データ工学ワークショップ/第5 回日本データベース学会年次大会(DEWS2007) L1-1 (ロングセッション) 2007年  
  • 江藤 正己
    三田図書館・情報学会研究大会発表論文集 2006 9-12 2006年  
  • 江藤 正己
    日本図書館情報学会春季研究集会発表要綱 47-50 2006年  
  • 原田 隆史, 江藤 正己, 沈 佳俊
    三田図書館・情報学会研究大会発表論文集 125-128 2005年  
  • 江藤 正己
    三田図書館・情報学会研究大会発表論文集 9-12 2005年  

書籍等出版物

 7

講演・口頭発表等

 3

共同研究・競争的資金等の研究課題

 5