İş Zekam NET

Bu site Makine Öğrenmesi, Veri Madenciliği, İş Zekası, Biyoenformatik konuları hakkında,teknoloji bağımsız olarak başlangıçtan ileri düzeye kadar türkçe bilgi sunmayı amaçlamaktadır.

Metin Madenciliği (Text Mining)

Bu yazının amacı, literatürde metin madenciliği (text mining) veya metin veri madenciliği (text data mining) kavramını açıklamaktır.

En basit anlamda, metin madenciliği çalışmaları metni veri kaynağı olarak kabul eden veri madenciliği (data mining) çalışmasıdır diğer bir tanımla metin üzerinden yapısallaştırılmış (structured) veri elde etmeyi amaçlar. Örneğin metinlerin sınıflandırılması, bölütlenmesi (clustering), metinlerden konu çıkarılması (concept/entity extraction), sınıf taneciklerinin üretilmesi (production of granular taxonomy), duygusal analiz (sentimental analysis), metin özetleme (document summarization), varlık ilişki modellemesi (entity relationship modelling) gibi çalışmaları hedefler.

Yukarıdaki hedeflere ulaşılması için metin madenciliği çalışmaları kapsamında enformasyon getirimi (information retrieval)hece analizi (lexical analysis), kelime frekans dağılımı (Word requency distribution), örüntü tanıma (pattern recognition), etiketleme (tagging), enformasyon çıkarımı (information extraction), veri madenciliği (data mining) ve hatta görselleştirme (visualization) gibi yöntemleri kullanmaktadır[1].

Metin madenciliği çalışmaları, metin kaynaklı literatürdeki diğer bir çalışma alanı olan doğal dil işleme (natural language processing, NLP) çalışmaları ile çoğu zaman beraber yol yürümektedir. Doğal dil işleme çalışmaları daha çok yapay zeka altındaki dil bilim bilgisine dayalı çalışmalarını kapsamaktadır. Metin madenciliği çalışmaları ise daha çok istatistiksel olarak metin üzerinden sonuçlara ulaşmayı hedefler. Metin madenciliği çalışmaları sırasında çoğu zaman doğal dil işleme kullanılarak özellik çıkarımı da yapılmaktadır.

Genel olarak klasik bir metin madenciliği çalışmasını aşağıdaki şekilde özetleyebiliriz.

Metin_madenciligi_text_mining

Yukarıdaki şekilde de görüldüğü üzere, bir metin veri tabanından alınan veriler öncelikle bir özellik çıkarımına tabi tutulur. Ardından çıkarılan özellikler üzerinde bir makine öğrenmesi algoritması çalışır (sınıflandırma (classification), bölütleme (clustering), tahmin (prediction) v.b.) ve neticede yapılandırılmış veri (structured data) elde edilir.

Buradaki makine öğrenmesi aşaması genelde kullanılmakla birlikte, metin madenciliği için şart olmayan bir aşamadır. Bazı durumlarda, doğrudan çıkarılan özellik aranan yapılandırılmış veri olabilmektedir. Bazı durumlarda ise makine öğrenmesi adımı yerine, istatistiksel bazı farklı yöntemler kullanılabilir.

Metin kaynakları, genelde doğal dilde yazılmış kaynaklardır. Yani bir gazetedeki köşe yazıları, bir kitap, bir makale olabilir. Hatta internet üzerindeki web siteleri bile metin kaynağı olarak görülebilir (bu konu daha özel olarak web madenciliği (web mining) olarak da adlandırılmaktadır). Bu yazıların, metin madenciliği açısından önemli bir de üst bilgileri olması söz konusudur. Örneğin yazının tarihi, yazının yayınlandığı web sitesi, yazar bilgisi gibi, yazının içerisinde yer almayan ancak yazı ile ilgili metin madenciliğinde kullanılabilecek önemli üst bilgiler (meta data) bulunabilir.

Özellik çıkarımı (feature extraction) aşamasında, metinlerin doğrudan içeriğinden veya üst bilgilerinden yararlanılarak istenilen özellikler çıkarılabilir ve çıkarılan özellikler üzerinde işlem yapılabilir.

Örnek Metin Madenciliği uygulaması:

Örneğin elimizde 100 adet yazı olsun. Bu yazıları yazan yazarları biliyor olalım (diyelim ki 5 farklı yazarın 20’şer adet yazısı olsun). Yeni gelen 101. Yazının bu 5 yazardan hangisine ait olduğunu bulmak, klasik bir metin madenciliği uygulamasıdır ve literatürde yazar tanıma (author recognition) olarak da geçer.

Burada örnek olarak metinlerdeki kelime kullanma sıklıklarını özellik çıkarımı için kullanmak isteyelim. Yani yazarlarımızı kullandıkları kelime sıklıklarından tanıyabileceğimizi düşünüyoruz (author attribution). Her metinde ve dolayısıyla her yazar için hangi kelimeyi ne sıklıkla kullandığı bilgisi bizim özellik çıkarımı aşamamız oluyor.

Ardından kullanılan kelime sıklıklarını örnek olarak makine öğrenme algoritması olan KNN algoritmasına veriyoruz ve diyelim ki yazarını tanımak istediğimiz 101. Yazı için her kelime için en çok kullanan yazarları listeliyoruz. Neticede bize bir olası yazarlar listesi çıkıyor ve biz de en yüksek ihtimalle hangi yazarın bu yazıyı yazmış olabileceğini söylüyoruz. Bu çıkan sonuç aslında 101. Yazı için anlamlı ve yapılandırılmış bir sonuç olarak kabul edilebilir.

Metin madenciliğinin çalışma alanları:

Metin madenciliği sırasında genelde aşağıdaki problemlerle ilgilenilir (bunlarla sınırlı değildir).

Enformasyon Getirimi (Information Retrieval): Bu aşama ilgilenilen külliyet (derlem, corpus) hakkında ön bilginin toplandığı aşamadır. Örneğin metin madenciliği web üzerindeki veri kaynakları üzerinde yapılacaksa web sayfaları, adresleri veya dosya sistemi üzerindeyse dosyaların tarihleri, kullanıcı bilgileri, dosya isimleri, dizin bilgileri gibi bilgilerin toplandığı aşamadır.

Doğal dil işleme aşaması (natural language processing): Bu aşama bütün metin madenciliği aşamalarında kullanılmasa bile genelde özellik çıkarımı ve metinden bazı anlamsal bilgilerin elde edilmesinde sıklıkla başvurulan aşamadır. Örneğin, konuşma parçalarının etiketlenmesi (part of speech tagging) veya cümlebilimsel parçalama (syntactic parsing) veya diğer dilbilimsel işlemler doğal dil işleme aşamasında yapılır.

Adlandırılmış varlık tanıma (named entity recognition): Genellikle metin işleme aşamasında istatistiksel bazı özelliklerin çıkarılması için kullanılır. Örneğin, metnin içerisindeki kişi isimleri, yer isimleri, semboller, kısaltmalar v.s. bu yöntemle bulunur. Metin madenciliği çalışmalarının her zaman temiz metinlerde yapılmadığını hatırlatmakta yarar vardır. Örneğin facebook, twitter mesajları, telefonlardan yollanan SMS mesajları gibi mesajların çoğunda yazım hataları hatta kısaltmalar kullanılmaktadır. Metin madenciliği bu ihtimallerin de göz önünde tutulması gereken çalışmalardır. Örneğin ‘’osmanbey’’ kelimesi, istanbulda bir semt ismi olabileceği gibi bir kişi ismi de olabilir. Adlandırılmış varlık tanıma çalışmalarında, hedeflenen kelime gruplarının metin içerisinden çıkarılması, sayılması, yoğunluğunun bulunması, etiketlenmesi gibi işlemler yapılabilir.

Örüntüsü tanımlı varlıkların bulunması (pattern identified entities): Bazı durumlarda, metnin içerisinden özel bazı bilgilerin metin madenciliğine konu olması mümkündür. Örneğin e-posta adresleri, telefon numaraları, adresler, tarihler gibi bazı bilgileri özel olarak almak isteyebiliriz. Genelde bu durumlarda düzenli ifadeler (regular expressions) veya içerik bağımsız gramerler (context free grammers) tanımlanarak metin üzerinde çalıştırılır[2].

Eş Atıf (Coreference): Bir varlığa işaret eden (atıf eden) isim kelime gruplarını ve diğer terimlerin bulunması/ayrılmasını hedefler.

İlişki, kural, olay çıkarımları: Çeşitli amaçlarla metnin içerisinden bazı bilgilerin çıkarılması istenebilir. Örneğin doktora çalışmam sırasında, verilen bir metnin içerisindeki olayları çıkararak sıralamak (event ordering) üzerine çalışmış, Türkçedeki fiil yapılarını, olay belirten kelime gruplarını, zaman kalıplarını ve bütün bu kelime grupları arasındaki olası ilişkileri gösteren özel bir matematik tasarlamıştım[3].

Duygu analizi (sentimental Analysis) : Metinlerde geçen duygusal ifadelerin çıkarılmasını amaçlar. En sık kullanılanı duygusal kutupsallıktır (sentimental polarity). Buna göre bir konu hakkında geçen mesajların veya yazıların olumlu veya olumsuz olmasına göre iki sınıfa ayrılması hedeflenir[4]. Ancak duygu analizi bunun dışında, metinlerdeki ruh hali, kanaat ve daha karmaşık duyguların çıkarılması üzerinde de çalışmaktadır.

[1]Sadi Evren SEKER, Cihan Mert, Khaled Al-Naami, Nuri Ozalp, Ugur Ayan (2013), Correlation between the Economy News and Stock Market in Turkey., International Journal of Business Intelligence and Review (IJBIR), vol. 4, is. 4, pp. 1-21, 2013

[2] Şadi Evren ŞEKER, “Turkish Query Engine on Library Ontology”, IKE12, Internet Knowledge Engineering, 2012, ISBN:1-60132-222-4, Pages:26-33

[3]Sadi Evren SEKER, Banu DIRI, International Conference on Artificial Intelligence konferansı dahilinde , "Proceedings of International Conference on Artificial Intelligence", bildiri “TimeML and Turkish Temporal Logic”, pp. 881-887, ICAI 2010

[4] Sadi Evren SEKER, Khaled Al-NAAMI “Sentimental Analysis on Turkish Blogs via Ensemble Classifier“, PROCEEDINGS OF THE 2013 INTERNATIONAL CONFERENCE ON DATA MINING, ISBN:1-60132-239-9, DMIN, pp. 10-16,  2013

NORA (Non-Obvious Relationship Awareness) Görülmez İlişki Farkındalığı

Bu yazının amacı literatürde kısaca NORA olarak geçen ve İngilizce Non-Obvsious Relationship Awareness kelimelerinin baş harflerinden oluşan ve Türkçe’ye görülmez ilişki (bağlantı) farkındalığı olarak çevrilebilecek olan kavramı açıklamaktır.

Kavram basitçe, birden fazla veri kaynağı kullanılarak, veri kaynaklarının tek başına çıkarım için yeterli olmadığı sonuçlara ulaşmayı hedefler. İlk başlarda, terörist grupları veya suç örgütlerini bulmak gibi amaçlarla literatüre girmiş olsa da günümüzde gerek ekonomik gerek sosyal çok farklı amaçlarla kullanılmaktadır.

Örnek:

Bir kullanıcının bir seyahat sitesinde Antalyadaki tatilleri arattığını düşünelim. Bu kullanıcının Facebook üzerinden eşi olarak belirlediği kişinin girmiş olduğu yemek sitesinde, Antalyadaki tatiller ile ilgili ilanların gösterilmesi basit bir NORA uygulamasıdır.

NORA uygulamasını çeşitli kara liste uygulamalarında da görebiliriz. Örneğin kumarhanelerin, kart saymak veya hile yapmak ile ünlenmiş oyuncular ile ilgili listeleri tutmaları ve bu listeler üzerinde NORA uygulaması yaptığı bilinen bir gerçektir. Buna göre hile yapan kişi ile aynı cep telefonu numarasına sahip olan (isim değiştirme ihtimaline veya takma isimlere karşı), kişilerin de kumarhanelerde çalıştırılmasının yasaklanması gibi uygulamalar bulunmaktadır. Bu konuda güncel tutulan 18 farklı listeden hile yapma potansiyeli bulunan oyuncular takip edilmektedir.

NORA ile ilgili meseleler:

Veri çoğu zaman iyi kategorize edilmiş ve yapısallaştırılmış halde bulunmaz. Bu durum her ne kadar çalışmayı zorlaştırsa da çoğu zaman NORA çalışmaları için bir avantaj oluşturur. Çünkü sizin bulmak istediğiniz bilgiye kötü niyetli kişilerin erişmesi de güçleşmiş olur. Şayet bir NORA çalışması tamamen deşifre olursa, kötü niyetli kişilerin buna karşı önlemler alması ihtimali artar.

Veriniz zamanla daha akıllı hale gelir. Verinin üzerinde çalıştıkça ve veri kümeniz arttıkça sizin çıkarımlarınızı sağlama imkanınız ve dolayısıyla daha başarılı sonuçlara ulaşma imkanınız artar.

Kısmı bilgi genelde yeterlidir. Genelde yapılan iş gözetimli (supervised) sonuçlar çıkarmak olduğu için, beklenen sonuç ve ulaşma şekli genelde önceden tanımlanır. Bu durum, tanımlı olan sonuçlara çok hızlı ulaşılmasını sağlamaktadır.

Daha fazla veri her zaman iyidir. Güncel bir konu olan büyük veri (big data) kavramı, her ne kadar işleme açısından sorunlar oluştursa da, sonuca ulaşmak için geçen zamanı azaltır. Bunun basit bir sebebi vardır. Normalde veri büyüdükçe elde edeceğiniz bağlantılar daha yoğun ve daha doğrudan olacaktır. Örneğin 5 farklı veri kaynağındaki verilerin sadece yarısını alarak elde edebileceğiniz bir bağlantı yerine, bir veya iki veri kaynağının tamamını alarak ulaşmanız mümkündür. Bu yüzden veri kaynaklarınızın büyümesi genelde sonuçlara daha hızlı ulaşılmasını sağlar.

Sayılabilirlik önemlidir. Literatürde sayılabilirlik (countability, cardinality) olarak geçen kavram, bilgisayar işlemelerinde büyük bir öneme sahiptir. Örneğin kişiler, vakalar, işlemler gibi sayılabilir veriler her zaman tercih edilir. Bu verilerin üzerinden vektör elde etmek ve işlemek mümkündür. Buna karşılık sayılamayan değerler (mesela bir kişinin ne kadar tatil yapmak isteyebileceği, veya bir kurumun ne kadar kaliteli olduğu gibi) ise işlemede her zaman daha fazla yük ve bazı durumlarda sonuca ulaşamamak gibi problemler doğurur.

Kişilik hakları önemlidir ancak bir engel değildir. Kişisel bilgiler ile işlem yapılırken kişilik haklarını ihlal etmeme yolları (örneğin özet fonksiyonları (hashing) gibi) yanında çoğu kullanıcının kişisel bilgiler konusunda hassas olmadığı da görülmüştür (örneğin sırf bu amaçla yazılan bir oyunun, son kullanıcı sözleşmesinde açıkça bütün bilgilerinizi alıp her türlü amaçla kullanacağız yazmasına rağmen çoğu kullanıcının bunu okumadan onayladığı görülmüştür).

Kötü niyetli kişilerin de akıllı olabileceğini unutmamak gerekir. Genelde uygulanan yöntemler ve çıkarımlar belirli bir zaman sonra kötü niyetli kişiler tarafından da fark edilmekte ve buna karşı önlem alınmaktadır. Aradaki bu zaman teknolojinin de yardımı ile her geçen gün daha da azalmakta ve hayat daha da hızlanmaktadır. Bunun için kullanılan yöntemlerin açıklanmaması ve saklı tutulması büyük önem taşımakta ayrıca kullanım alanına göre kullanıcılara rahatsızlık vermeyecek seviyede tutulması gerekmektedir.

Metcalfe Kuralı (Ağ Etkisi , Network Effect)

Bu yazının amacı, literatürde Metcalfe kanunu olarak geçen (Metcalfe’s Law) kavramı açıklamaktır. Literatürde ağ etkisi (network effect) olarak da geçmektedir.

Kavram basitçe bir şebekedeki (ağdaki) kullanıcı sayısının artmasına bağlı olarak o şebekedeki trafiğin üssel olarak artacağı iddiasında bulunur.

Örneğin buradaki şebekeyi bir telefon alt yapısı olarak düşünecek olursak aşağıdaki gibi durum resmedilebilir.

metcalfe_kurali

Şekilde görüldüğü üzere, ağdaki telefon kullanıcılarının sayısı artıkça ikili görüşme ihtimalleri ve dolayısıyla ağda taşınan trafik artmaktadır. Basit bir şekil teorisi (graph theory) yaklaşımı ile ağdaki kullanıcı sayısı n olmak üzere, olası trafik ihtimali n2 olarak hesaplanabilir. Buradan yola çıkan Metcalfe trafiğin üssel olarak arttığını dolayısıyla şebekeye eklenen her yeni kullanıcının daha önceki kullanıcı sayısı kadar etkide bulunduğu dolayısıyla sistemdeki her artışın n+1, n+2, n+3 şeklinde artarken artan bir dizi olduğunu (incremental) iddia etmektedir.

Günümüzde bu teorinin etkisi, sosyal ağlarda önemli oranda görülmektedir. Elbette teorinin üzerinde ciddi eklentiler yapılmıştır. Örneğin teoride bütün kullanıcıların aynı oranda şebekeyi kullandığı kabul edilirken, sosyal ağlarda dil farklılığı kişilerin sosyal ağ kullanım oranları veya sosyal çevreleri gibi çok çeşitli faktörlerin eklenmesi gerektiği bir gerçektir. Bu anlamda değiştirilmiş bir hal olarak yine big-o gösteriminde, O(n x logn) şeklinde sosyal ağlarda kullanıldığı görülmektedir (bkz. Reed ve Odlyzko, veya Tongia ve Wilson’un çalışmaları).

Metcalfe yaklaşımının iş dünyasına etkisi de oldukça tartışılmış konulardan birsidir. Örneğin bir ortamdaki büyük ve küçük işletmelerin aynı miktarda müşteriye ulaşabiliyor olması, bir ikilemi de beraberinde getirmektedir. Büyük firmalar için tehdit, küçük firmaların hak ettiklerinden daha fazla müşteriye ulaşabiliyor olması gerçeğidir. Küçük firmalar için tehdit ise, büyük firmaların oluşturduğu itibar, pazarlama politikaları veya yenilikler (innovation) ile aynı ortamdaki müşterilerin küçük firmalara kaymasını engelliyor olmasıdır.

Yukarıdaki sosyal ağ ve iş dünyası örneklerinden de anlaşılacağı üzere Metcalfe teorisi olarak bilinen teori günümüz yaklaşımlarına bir temel oluşturmakla birlikte, günümüzdeki ayrışık (heteregenous) ortamlarda tam olarak kullanılamamaktadır.

Pareto Prensibi

 

Bu yazının amacı, literatürde Pareto Diyagramı  olarak geçen yaklaşımı açıklamaktır. Bu yaklaşım şu hipotez üzerine kuruludur : ‘’olayların öyle bir %20’i vardır ki, sonucun %80’ini etkiler ve öyle bir %80’i vardır ki sonucun %20’sini etkiler’’. Bu yaklaşım işletme, ekonomi ve yönetim gibi çok sayıda bilim için kullanışlı bir temel teşkil etmektedir. Genel görüntüsü aşağıdaki şekilde çizilebilir:
pareto

 

 

Olay ve neticelere göre değişmekle birlikte çoğu olayda bir iki puan farkla olsa da yukarıdakine benzer bir dirsek (köşe) yakalanabilir.
Örneğin bir ülkedeki veya bir işletmedeki kişilerin %20’si kararların %80’ini etkilerken diğer %80’i kararların %20’sini etkilemektedir denilebilir.
Başka bir örnek, basın yayın kuruluşlarının (örneğin gazetelerin veya televizyonların) öyle bir %20’i vardır ki, reklam pazarının, veya ülkedeki ratinglerin %80’ini etkilemekte, öyle bir %80’i vardır ki geri kalan %20’yi paylaşmaktadır denilebilir.
Başka bir örnek, bir seçim sonucunda alınan oyların %80’i seçime giren partilerin %20’si tarafından paylaşılırken, geri kalan %20’lik oyların, seçime giren diğer %80 parti tarafından paylaşılması şeklinde verilebilir.
Pareto prensibi, yazılım dünyasında da sıkça kullanılan bir yaklaşımdır. Örneğin Microsoft firması, rapor edilen hatalardan %20’lik bir kısmın çözülmesinin geri kalan %80’lik bozulma ve hataları da olumlu etkileyeceğini bulmuştur. Yine bir iddiaya göre kodun %20’lik bir kısmında, koddaki hataların %80’inin bulunabileceği söylenmiştir.
Pareto prensibi, bu örneklerdeki 80-20 oranı bazı durumlarda değişse bile genelde yakın sonuçlar elde edileceği üzerine kurulan bir prensiptir. Pareto prensibinin bu konuda çalışanlara esas kazandırdığı, olayların bir kısmının (Genelde %20’lik kısım) diğerlerinden çok daha önemli olduğu ve bir iş yapılırken bu önemli kısmın bulunup üzerine gidilmesinin önemidir.
Pareto diyagramı, Histogram analizi gibi çok sayıda analiz ile de birlikte kullanılabilir. Örneğin bir hastanedeki hastaların sayılarını ele alalım. Aşağıda, tablo olarak hastalıkları ve yıl içerisinde hastaneye gelme oranları verilmiş olsun:
H1 : %50
H2 : %1
H3 : %3
H4 : %4
H5 : %2
H6 : %4
H7 : %1
H8 : %30
H9: %1
H10: %2
H11: %2
Bu hastalıkların histogramı aşağıdaki şekilde çizilebilir:

 

pareto_hastalik_oran

Bu histogram üzerine toplamsal bir grafik çizecek olursak (cummulative histogram) aşağıdaki gibi bir şekil çıkar:

pareto_hastalik

Yukarıdaki şekilde bulunan histogramın üzerine ilave olarak toplam grafiği çizersek aşağıdaki gibi bir görüntü olur.

Yukarıdaki bu yeni görüntüye bakılacak olursa ikinci hastalığa kadar dik bir yükseliş ve ardından da yataya yakın bir yükseliş görülebilir. Bunun anlamı ilk iki hastalığın sonuca en fazla etkisi olan, veya hastane için en kritik önemdeki hastalıklar olduğudur.

Çevrimiçi Kimlik (Online Identity)

Çevrimiçi ortamlarda oluşturulan kimliklere verilen isimdir. Basitçe bir kişiliği ifade eder. Bu kimlik sanal/uydurma veya gerçek kimlik olarak sınıflandırılabileceği gibi bazı çalışmalar açısından da bir kişinin birden fazla kişiliği yansıttığı göz önüne alındığında, bütün kimliklerin gerçek olduğu söylenebilir.

Internet sitelerinde, sosyal ağlarda, internet üzerinde oynanan oyunlarda kişiler kendilerini birebir yansıtan isimler ve şekiller seçebileceği gibi tamamen farklı seçimlerde de bulunabilir.

Teknik açıdan bu kimliklerin bir grupta toplanması (mesela aynı IP adresinden giren kimliklerin tespit edilerek aynı kişiye bağlanması) veya kimlik hırsızlığı (kişisel bilgilerin açık olmadığı durumlarda farklı bir kişiliği taklit ederek çıkar sağlama, veya kişiliğe zarar verme, mesela sosyal ağlarda kendisini ünlüler gibi tanıtan kişiler) gibi konularda çalışılmaktadır.

Bunun yanında psikoloji açısından kimlikler ve davranışları, kişi|kimlik ilişkisi ve kimlik ortam ve çevre ilişkisi | çatışması gibi konular da çalışılmaktadır.

Örneğin kişiler kendilerini saklama ihtiyacı hissedebilirler. Bu duruma maskeleme ismi verilir ve kişiye sorulan sorulara, belirli ölçüde farklı cevaplar verilir. Burada cevaplar doğru veya yanlış değildir. Örneğin isim kısmına kişi kendi ismini yazmasa bile başka bir isim yazarak geçer. Bu yazılan isim ise maskenin arkası hakkında bilgi vermektedir. Örneğin bir sinema yıldızının ismini yazan kişinin en azından sinemalara ilgisinin olduğunu ve hatta yazdığı kişi hakkında bilgi sahibi olduğunu (bu filimi izlediğini) ve hatta etkisi altına kaldığını çıkarabiliriz.

Wiszniewski ve Coyne, çalışmalarında, bu maske kimliklerin (verilen sahte bilgilerin) eğitim seviyesi ile ilgili olduğunu ortaya koymuşlardır.

İtibar Yönetimi

İnternet üzerinde müşteri tarafında yapılan ticaretin önemli bir kısmı itibar yönetiminin başarılı olmasına bağlıdır. Buradaki ticareti ikiye ayırabiliriz. İşletmeden müşteriye (B2C) ve müşteriden müşteriye (C2C). İşletmeden müşteriye olan ticaretin zaten internet dışında da belirli bir itibar gereksinimi vardır ve bu itibar internet üzerine taşınır. Fakat daha ilginç olanı müşteriden müşteriye (C2C) ticarettir ve buradaki itibar ihtiyacı e-bay veya amazon gibi firmaların doğmasına ve bu kadar büyümesine sebep olmuştur. Örneğin bir müşterinin farklı bir müşteriye satış yapması sırasında tutuklu ikilemi (prisoner’s dilemma) ismi verilen bir problem yaşanır. Yani iki tarafın da birbirine güvenmesi gerekir ki zindandan kurtulabilsinler. Veya ticaret için düşünecek olursak ticaretin gerçekleşebilmesi için iki tarafın birbirine güvenmesi gerekir. Bu durum ise her alışverişte gerçekleşmesi gerçekten zor bir durumdur. Bu açığı gören e-bay gibi firmalar, sadece itibar yönetimi yaparak iki tarafı bir araya getirmekte ve yaşanan anlaşmazlıkları çözmekte, bunun karşılığında ise her alışverişten komisyon almaktadırlar. Buradaki kar sistemi aslında itibar üzerine kuruludur.

Ayrıca itibar yönetiminin geçişli bir fonksiyon (transitive function) olduğunu da söyleyebiliriz. Yani alışverişlerde her satıcı ve alıcı için ayrıca diğer satıcı ve alıcıların vermiş olduğu geri bildirimlerden (feedback) oluşan bir itibar değeri daha oluşur. Bu durumda aracı web sitesinin itibarı, bu geri bildirim itibarı ile etkileşmekte ve iki itibarın birleşiminden (correlation) oluşan bir değer elde edilmektedir.

Ayrıca bir kişinin güveninin sarsılması durumunda (ayıplı bir ticaret durumunda) bu kişilerin yeni kimliklere başvurduğu da görülmüştür. Buna dijital ayak izi (digital footprint) ismi verilmektedir ve kişinin bütün dijital izini silerek yeni bir kimlik oluşturması beklenir. Bu durum kişinin dijital ortamdaki itibarını kaybetmesi anlamına gelir ve yeni bir satıcı / alıcı seviyesine iner.

Benzer durumun işletmeler veya organizasyonlar için çok daha maliyetli olduğu görülmektedir.

Yine internet üzerindeki her itibar o siteye aittir. Örneğin aynı kişinin farklı sitelerde sahip olduğu itibarlar ayrı ayrı değerlendirilmelidir ve birbiri ile ilişkisi çok zayıftır (genelde bir satıcı veya alıcı muhatap ararken diğer sitelerdeki itibarına nadiren bakmaktadır). Ancak yeni bir kavram olan açık kimlik (openID) kavramı sayesinde bir kişinin farklı sitelerde sahip olduğu itibarın tek bir merkezde toplanması hedeflenmektedir. Ancak bu teknolojinin kullanılabilmesi için sitelerin bu teknolojiye izin vermesi gerekir.

Çevrimiçi Saldırganlar

Çevrim içi saldırganlar (online predators), çevrim içi kimliklere değişik sebeplerle saldırırlar. Genelde bu saldırının amacı cinsel içerikli, finansal veya politik olabilir. Bu saldırılardan en önemli zararı gören grup ise gençlerdir. Zaten henüz kişiliği tam oturmamış genç yaştaki kullanıcıların internet üzerinde planlı bir şekilde saldırılara maruz kalması artık oldukça kolay bir hal almıştır.

Kimliklerin Sahipliği

İnternet üzerinde oluşturulan kimliklerin sahipliği de bir problem olmaktadır. Örneğin Sony tarafından üretilen bir oyun olan EverQuest oyunundaki bir karakterini e-bay üzerinden satmak isteyen bir kullanıcı için Sony firması e-bay’in satışı durdurmasını istemiştir. Oyunun son kullanıcı sözleşmesinde oyundaki bütün karakterlerin Sony firmasının entelektüel sermayesi olduğu ve izni olmadan satılamayacağını bahane gösterdiği bu girişim e-bay firması tarafından durdurulmuştur. Benzer durum facebook, twitter gibi sosyal ağlarda ve hatta gmail, Hotmail gibi posta hesaplarında da yaşanmaktadır. Dolayısıyla bu hesapların kime ait olduğu tartışması günümüzdeki sorunlu konulardan birisidir.

Bu problemler, literatürde ‘tuğla ve harç’ (Brick and mortar) olarak geçen kavramı öne çıkarmaktadır. Buna göre gerçekten elle tutulabilir tuğla ve harçtan yapılmış işletmelerin, yani bir ürün üreten ve bu ürünü müşterinin görebildiği, dokunabildiği işletmelerin sahiplik, gizlilik veya kişisel haklar gibi problemlerden uzak olmasıdır.