En aktuell version av denna lista finns på URL: http:/dsv.su.se/jpalme/exjobbsforslag.html Om du får denna lista på papper: Kolla gärna
på webben, där kan kanske finnas en aktuellare version med
nya förslag som inte finns i den pappersutskrift du fått.
Jag kan handleda projektarbetsuppgifter
inom följande områden:
Elektronisk post, forumsystem, elektronisk publicering, medier för
kommunikation mellan människor med hjälp av datorer.
Distribuerade tillämpningar
och datornätstillämpningar, client-server-system.
Programmeringsspråksteknik/metodik.
Människa-dator-interaktion.
Beteendevetenskapliga studier av användning
och effekter av datorer och datortillämpningar.
Searching, answering questions and finding information on the Internet.
Topics
for master's theses suggested by Jacob Palme
Lower case or parenthesizes mark topics which I believe someone else
is already working on. Even topics which are not marked in this way may
be occupied, ask me.
The list is in a mixture of English and Swedish. You can write the thesis
in either language, independently of which language is used in the topic
description below.
The list is sorted by adding new topics at the beginning of the list.
Thus, topics low down on the list are very old and may not be suitable
any more today. Theses can be written in Swedish or English, irresspective
of the langauge of the thesis topic description below.
Even if a task is described in English below, you can write your
thesis in Swedish if you so prefer.
Use of synonym dictionary to improve cross-lingual question-answering. Investigate by experiments whether a system for cross-ingual question-answering will provide better results, if it uses a synonym dictionary to recognize otherwise unrecognizable words in questions.
User dialogs with a question-answering system
Trygg-Hansa runs a question-answering system that answers around 70% of user questions. The overall system's performance is good, but we believe it could be better if we had a better understanding of user behavior. This master thesis would search for patterns in user behavior, repeated chains of questions being asked, and come up with suggestions how to meet user expectations even better.
The thesis requires skills in the Swedish language. The supervisor for a thesis on this
subject will be Eriks Sneiders.
Same as above for the Web4Health web site, can be done in either Swedish or English.
Analyze the menu structure for finding information through a categories
list on the home page of http://web4health.info/ and subcategories. Suggest
and test one or more alternative menu structures to make it as easy as
possible for site visitors to find information on the web site using
this menu structure.
Would the http://web4health.info/ web site gain by establishing
visibility in Second Life or its own application in Facebook?
If so, how?
(Note: The Swedish magazine "Internetworld" No. 9, November 2007, had an
article about developing applications in Facebook.)
Menu editor. Many websites, including Web4Health include a large number of
menus (lists of links to pages) in different format. Design a prototype of a good editor for managing such menus, and evaluate the editor by user testing and keystroke level model analysis.
KEI formula. When doing Search Engine Optimization,
one important task is to find good search strings
to optimize for. An ideal search strings should
be popular in queries but not have high competiton
on the web. Different formulas try to compute
this in different ways. Compare different ways
of computing KEI and find which is best.
Quality of search results in medical search engines. Compare the
quality of search results for general search
engines like Google, Yahoo, MSN and Teoma with
specialized medical search engines (a list of
such can be found at http://web4health.info/en/answers/proj-search-other.htm or
for Swedish at http://web4health.info/sv/answers/proj-search-other.htm.
Test with multi-word queries like "Causes of
headache", "Symptoms of bulimia nervosa", "Interaction
between Prozac and Naproxen", Treatment of obesity".
Can be done in Swedish on Swedish search engines,
or in English on English search engines.
Time to view search result list. When people view a search result
list from for example Google, a hypothesis might
be that the time to view this list, before clicking
on one of the alternatives, is lower if the
chosen alternative is higher in the list. The
log files of http://web4health.info/ could be
used to investigate this, using the same method
as previously done in Christer Dalevind's thesis.
(Experiments with how links in web pages influence user
behaviour. The Web4Health web site has 6000 visitors per
day. This is so much, that it is possible to
make one-day experiments with different layout
and check how this will influence user behaviour.
Will users see more pages if there are more
links between the pages? Will too many links
between pages have the opposite effect? How
many links on a web page to other pages in the
site is optimal? How will layout of links between
pages influence usage of the links?)
Effects of ad color and placement on click frequency. Make some
experiments, on the web4health web site, which
has 6000 visitors/day, to see how different
coloring and placement of ads will effect how
often visitors click on links in the ads.
Search Engine Optimization and Content Management: How can Search
Engine Optimization (SEO) and Content Mangement Systems (CMS) be
combined? Which existing systems provide such combination, what
more could be done in such a combined system?
Here is
a Swedish medical search engine based on Google Custom Search.
Here is
a list of search engines, some of them using Google Custom Search,
in English. Evaluate either in Swedish or English whether these
search engines more often provide good answers to questions in
the medical
area than:
Ordinary Google search.
Google search with "site:" restriction to one or more of the
sites included in the custom search.
Internal search engine provided by the web sites included in
the custom search.
Method: Choose random queries written by actual visitors to medical
web sites, I have access to lists of queries to select from. Check
the goodness of the search result using the different methods. By
goodness can be:
Good readable and understandable information on what the query
asked for.
Not containing spamming or trying to sell something (sidebar
ads are OK, provided the main topic is good and the ads are
clearly separated from the main content.
Medically reliable information, not trying to sell some dubious
health cure like penis enlargment pills.
Use of synonyms in natural-language question answering: When
people ask questions to a natural-language question-answering system,
they may use different words for the same question.
For example, they may type the question "Effects of divorce on
children" or "Effects of parent separation on children" and mean
the same thing. Thus, natural-language question-answering systems
need to include synonyms of the terms and phrases they can handle.
This can be handled either by manually creating such synonym lists,
or by automatically using a synonym dictionary, or both combined.
There are obvious pros and cons of both alternatives.
This thesis will investigate these two alternatives, and find out
by practical experiments which alternative gives the best question-answering
result.
You can do the thesis work on either Swedish synonyms or English
synonyms, whichever you prefer. The natural-language question-
answering system in http://web4health.info/ can be used as an
experimental platform.
Natural langauge queston-answering Search Behaviour:
When people do a search using the QuickAsk search
engine in Web4Health, they get a list of answers. By analyzing the
log files from QuickAsk and Apache, it is possible to find out which
of these alternatives
was selected (if any) by the user doing the search. This is interesting,
since if no answer was selected, the users presumably did not find
any good answer to their questions, and if they selected an alternative
late
in the list, then the list was badly sorted. Write a program to do
this log file analysis and test it on Web4Health. The task might
also include improving QuickAsk templates in cases where the result
was not as good as it should
be, for some of the result. See http://web4health.info/ and
in Swedish,
http://web4health.info/sv/ to
see how QuickAsk works.
Dual-step searching. When a person makes a search on the
Internet, using a search engine like Google, the search is actually a two step process:
The person types a query string to Google and Google supplies a list of possible answers.
The person scans through the list of answers provided by Google and selects the
answer which seems to best fit what the person wanted to find. Sometimes, the person
looks at more than one of the articles listed by Google before finding a good
answer.
Write a paper which studies Internet searching including both these two steps.
As a conclusion of this two-step model, a search engine like Google
may improve the search result by providing a variety of different
kinds of answers. For example,
if a person searches with the search string "flowers" it might be better
for Google to return a list containing one article about where to
buy flowers, one about
flowers as a biological concept, one about how to draw flowers, one
about computer tools for drawing flowers, one about an inventory
of different kinds
of flowers, etc. This might increase the sucess of the second step
of the query more than if the list provided by Google contained ten
articles about different flower shops or ten articles about flower biology.
The paper could also involve an investigation of whether major search
engines do in fact try to list a variety of different aspects of the query
in the list of answers returned (usually the first 10 answers listed).
This could be investigated by testing the different search engines.
Web-based-editing. It is very practical to let an application
run entirely on the server and only have an ordinary web browser
as client. Unfortunately, it is not easy to design a good
WYSIWYG text editor in this way. This thesis could evaluate
the options, look how other people have solved this, and
maybe also develop a prototype of one variant as an
example.
Development of a bilingual dictionary for evaluating term extraction
within the psychological domain of Web4health portal. Powerful tools
are available to make the process mostly automatic.
For more information about this particular task, contact Andrea
Andrenucci, e-mail <andrea@dsv.su.se>.
Detta magisteruppsatsämne avser utvärdering av en svarsmotor - ett fråga-svar system, nämligen en tjänst installerad hos Trygg-Hansa. Följande punkter är av intresse:
Mätning av träffsäkerhet hos svarsmotorn samt medföljande sökmotor.
Analys av kriterier som påverkar träffsäkerheten, trade-offs.
Hur ser typiska frågor ut?
Analys av frågeflödet, finns det mönster hos frågor som följer varandra från en användare?
etc.
Det finns verktyg som hjälper att utföra analysen. Testa gärna svarsmotorn och kontakta Eriks Sneiders om du har ytterligare frågor.
More and more often, gadgets which we use have computers in them, even
though we do not regard them as primarily computers. Examples: Dishwashers,
micro ovens, mobile phones, video recorders, etc. Some of them have rather
complex user interfaces. Evaluate the user interfaces of for example a
set of mobile phones or a set of video/dvd hard disk recorders.
Part of such an evaluation might be to ask a number of users of the kind
of device which functions they most often use. Since such devices are something
used very often, the user interface should not only be easy to understand,
but the common actions should also require as few steps/clicks as possible.
If you choose this topic, and want to look at video/dvd hard disk recorders,
I can write a text with my own experience, which can be of use as start
for such a thesis.
The Keystroke Level Model may be a good research method for this
thesis, http://www.cs.umd.edu/class/fall2002/cmsc838s/tichi/printer/goms.html
( Measure the
success of search engine optimization (SEO). By search engine
optimization is meant modifying a web site, so
that it will
get better positions in search results from Google and other large
search engines. There are many companies who specialize in SEO,
so knowing SEO will give you competence which is of value when searching
for a job after your exam. To measure the success of search engine
optimization, you need to look at
pages which have been optimized, see how well they fare, see
if
they fared
well after optimization, and which criteria characterizes a page
which gets high results in Google searches. Jacob Palme has done
search
engine optimization of a number of Web4Health pages, partly using
the famous but controversial KEI-analys formel, one result of your
study could be another, better KEI formula (http://www.wordtracker.com/help/keihelp.html).
This link goes to a more detailed description
of this task in Swedish. I can translate this more detailed description
to English if an English-language student wants to tackle this task.
)
Make an overview of multi-lingual content management
techniques. I have written a paper on this at http://tinyurl.com/ce6ff,
but your paper should also study what other people have done and
describe what should be required of a good such system.
Is it possible to predict the position a web page will
get in Google result listings. Various measurements of the competition
does not seem to be well correlated with actual position. Why? Web4health can be used as a test tool.
What is the correlation between Wordtracker prediction and real
number of visitors to a page in Web4Health?
Why?
Define the state of the art in Cross Lingual Question Answering
and find the weaknesses of the available approaches. What is missing
and what can be done?
Home DVD recorders with hard disk.
A new product, DVD writers with hard disk have emerged during
recent years in the consumer electronics market. There are also
software packages for turning a PC or a Macintosh into a similar
media center.
Typical facilities of such
media centers are to record television programs on hard disk or
DVD in a format that ordinary DVD players can read. Thes are
quite complex, compared to other consumer electronics systems,
and their HMI design is often not ideal. In this topic, I suggest
that some of the market leading products for these kinds of units
are examined for their HMI qualities. I have two such machines
at home,
so I can provide
some input based on my personal experience with
these systems, on how to test and which attributes to measure.
My general impression for the models I have at home is that the
manufacturers have been in too much a hurry to get a product out,
and not had
time
for enough user testing of the HMI.
New models correct some HMI problems with the previous model, but
instead
introduce new HMI problems.
The Keystroke Level Model may be used for this thesis.
(Content
Management Systems and standards: Investigate,
for some common content management systems, how well they are
in producing correct HTML
and CSS, and how well they are
in producing pages which are accessible to disabled people. Also
look at whether they produce search-engine robots friendly coded
(HTML links, not too much information hidden from robots by Javascript).
)
Self Help Guides:
By Self Help Guides is meant computer software which helps people changing
their way of life, for example
stopping smoking, curing an eating disorder, etc. There are many
such guides available. Make an overview of these systems, describing
how they work, how they are constructed, how effective they are in
improving health.
Här är tre uppsatsämen från Fredrik
Dolleus <fredrik.dolleus@sll.se>
som arbetar med Vårdguiden:
Hur kan man mäta transaktionskostnader och omfördelningseffekter
genom
att använda
andra servicekanaler som tex webb och telefon.
Hur ser
hälsosurfarnas användarbeteende ut, vilka tjänster
vill man ha.
Hur påverkas individens beteende av information via
webb och telefon. Vad
hade de gjort ist ället om de inte använt dessa kanaler?
Web page content effect on user behavior:
The Web4Health web site contains
about 900 informational pages most of them available in multiple
languages. Some of the pages are long and detailed, others are short
and concise. Some of them contains a large number of links to other
pages in or outside Web4Health, others contain no specific such links
(a few general links are included in all pages). All the main pages
contain a button
, which returns a list
of related pages created by the Web4Health software.
In this work, you will investigate how the difference between
different Web4Health pages influences user behavior. You will
need to use or write software to analyze the Apache logs, which
shows how users use Web4Health, and also software to analyze
the Web4Health pages, counting the number of links, etc. Then
this date is combined to give a description of how different
content of different pages influences whether users stay or
leave Web4Health, and other user behavior.
Clicking links versus searching: A
study of the usage of the Web4Health web site shows that users click
on internal site links
more often than they use the built-in search engine. A previous
master's thesis at DSV has investigated how easy it is to find information
by using the built-in search engine in Web4Health and three other
Swedish medical web sites. Extend this study in either of two ways:
Make a similar comparison of how easy it is to find answers
to a question by clicking on links (including or excluding
the "Find
a few related answers" button in Web4Health) on the same
four web sites.
Make a similar comparison on only Web4Health, studying in
more detail why and how people choose to click on links more
than
use the search engine and whether this is actual optimal behavior
in finding what they are looking for.
The Web4Health data base is at present available in English,
Swedish and German, and partly in Italian, Finnish and Greek. Develop
a version of the data base for a new language. It should be a language
which you know very well. And you will not have time to make a full
version of the data base to a new language, but you might do a partial
translation of the home page and menus, and have the actual texts
provided in English. Also make an evaluation of how useful such a
partial translation is for people using the language you have translated
the web site to.
Cross-lingual question-answering German-English in Web4Health.
The Web4health web site
provides natural-language question-answering in several languages, including
German. By cross-lingual is meant that answers are not only found
in German, but questions are translated to English and answers are
also found in the English data base. Evaluate how this influences
the results for German users of Web4Health, do they get better and
more easily found answers than if answers were only found in the
German data base.
Investigate and give an overview of how better editors could
improve the editing environment in a content management system like
KOm2002. Implement
some of what you have found suitable. This task includes user interface
design and user testing
combined
with
the restrictions of what common web browser allow using only HTML and
Javascript.
(Google secrets: Google has published some general principles of
how it works. Some other investigators have tried to find out more.
But there
are also secrets, which Google will not divulge. First make a review
of what is already known about how Google works. Then make a number
of tests,
in order to find out more about the inner secrets of Google. This is
a task for an imaginative and clever person! More
info.
Another
paper of interest. )
www.wordtracker.com
erbjuder en tjänst där man (mot betalning) kan söka
i en databas
över hur ofta folk ställer olika sökfrågor.
Vad jag vet finns ingen motsvarande tjänst för sökningar
på svenska.
Detta exjobb skulle innefatta att ta fram en liknande tjänst
på svenska.
Jag kan ordna så att ni får tillgång till loggar
av söktermer i Web4Health.
Värdet av uppsatsen blir större, om ni även kan få tillstånd
av loggar av söktermer i andra svenska sökmotorer, t.ex.
Sunets söktjänst och
ev. Eniro. Men det vet jag inte om ni får. OBS: Om ni lyckas
med detta, är det inte osannolikt att ni kan sälja och
tjäna pengar på
den tjänst ni utvecklar.
Anmärkning: Det finns eventuellt redan en liknande svensk tjänst, se http://www.keywordmaker.com/.
Men den verkar vara väldigt liten och gammal.
(In a previous
thesis, two students compared the quality of four large Swedish medical
web sites, by checking how easily it was possible to find
good answers using the search engine built into each of the sites.
But it is well known that Internet users much more often click on
links than
they type questions in search engines. Compare how easily it is possible
to find answers in the same four medical web sites, by only clicking
on links. Preferably test the same questions, which the previous
study tested on search engines.)
(Compare the search tool QuickAsk as it is used in the web site
Web4Health with other search tools like Google, with and without "site:web4health.info",
Alkaline, SiteSeeker. Quality can be measured by measuring recall
and precision, probably best restricted to the first 10 answers listed.)
These two topics may be the same topic described in two different ways:
The web site http://Web4Health.info/ uses
an older version of QuickAsk.
A newer version of QuickAsk can
convert questions to SQL statements, which may mean that the classification
can be simplified
in Web4Health. Try this out, maybe also make a test implementation
and a comparison of the results in how well questions can be answered
and if
classification is simplified or not.
You may want to look at semantic net or semantic web technology.
The web site Web4Health does
not at present use semantic networks for question-answering. Investigate
if use of semantic network could improve the question-answering in
this web site. Since it is a medical web site, a semantic network
could for example use links like "cause", "diagnosis", "prognosis", "treatment", "side
effects", etc.
Humany har
utvecklat ett frågesystem som används av många kommuner, t.ex. Lidingö.
Skriv en utvärdering av deras system, och jämför för- och nackdelar
med det system QuickAsk som
vi utvecklat på DSV och som bl.a. används av Web4Health.
Jämför både teknisk kvalitet i sökresultaten, och
användardialogen för båda användare och administratörer.
Public domain-programvara för caching. När man lägger
upp en webbsajt, har man ofta länkar till andra bra webbsidor.
Men dessa bra webbsidor försvinner ofta, och länken fungerar
då inte. Google har en lösning
på detta, där de gör egna cachar av länkade
webbsidor. Gör en programvara
som laddar ner en godtycklig webbsida och skapar en cache liknande
den som Google gör. Cachen består då av ett mindre
antal filer, vanligen en HTML-sida och några GIF- och JPEG-filer,
och en smärre modifiering
av HTML-sidan, allt lagrat i en separat katalog för varje
cache och med enbart relativa länkar mellan filerna. Denna
uppgift passar bara KTH-studenter, inte SU-studenter.
(Google API is a service offered by Google which allows people
to develop different new services based on Google. Make an analysis
of
this offer, and develop your own applications based on the Google
API.
)
Internets föregångare: KOM-systemet vid QZ var under
åren 1978-1992 en föregångare till Internet. Ett
tusental datorentuisaster kunde diskutera med varandra i flera hundra
olika forum. Gamla loggfiler finns bevarade av det som skrevs i KOM.
Analysera dessa loggfiler och skriv en beskrivning av hur det hela
började. Skriv gärna även om andra liknande tidiga
tjänster, t.ex. Usenet news, och ev. även om de som misslyckades,
t.ex. Teledata.
Förslag från Eriks Sneiders <eriks@dsv.su.se>:
När det gäller Search Engine Optimisation, har jag sammanställt
ett antal viktiga features som går att optimera i mina kursbilder
*:66. Men fortfarande finns det ingen som tagit fram ämnet på
riktigt. Ett förslag på en magisteruppsats skulle kunna
vara Top 20 SEO Features. Då kan man referera uppsatsen, även
ha en enklare konferenspapper.
(DSV is implementing a medical information web site (http://web4health.info).
The site has more than 500 000 visitors (more than 2 million
hits) per month). Make a study of how visitors use this web site,
in
particular try to make conclusions of how the web site can be improved,
based on the information in these log files. This task may include
writing software to analyze the log files in new ways. Note: Of course
you need not analyze all the information in these large files,
you
can select only a sample of them.)
(Vid DSV har vi inom ramen för ett EU-projekt utvecklat ett
s.k. "content management system" (CMS) för hantering
av en medicinisk web-sajt (http://web4health.info).
Det finns också generella CMS-system, t.ex. systemet EPIserver
från det svenska företaget Elektropost eller public-domain-systemet
Zope. Uppsatsens syfte skulle vara att göra en försöksimplementering
av det vi gör i EU-projektet med användning av EPIserver,
och på
grundval av detta utvärdera vilka för- och nackdelar det
för vårt projekt hade varit att använda EPIserver
istället för att utveckla ett eget system. )
Vilken är den bästa metoden att hitta information i ett
Intranet? Jämför fri-text-sökningssystem, system baserade
på semantiska nätverk, naturligt-språk-fråge-besvarande
system, system baserade på hierarkiska träd som användaren
letar i, vilken metod gör att användaren snabbast hittar
det de letar efter? Hur passar olika system för olika användargrupper?
Testa hur väl First Class-systemets koppling till e-post överenstämmer
med Internets standarder och konventioner för hur e-post skall
fungera.
Någon uppsats inom området web site content management
systems. Se t.ex. http://www.cmswatch.com/
för information om sådana system. Uppsatsen kunde t.ex.
analysera gruppinteraktionsmöjligheterna i sådana system,
och då även titta på funktionerna i det system KOM2002
som DSV har utvecklat.
I sin doktorsavhandling skriver Sirkku Männikkö: "We
need to seriously consider whether it is justified to expect that
people spend more time learning about and fixing the machine than
actually using it. The message to the developers is quite obvious:
get simple!". Undersök detta fenomen. Hur mycket tid ägnar
olika grupper av datoranvändare åt att lära sig
tekniken, och lösa problem med tekniken, och hur lång
tid åt
produktig användning av tekniken? Skiljer det sig för olika
användargrupper och olika tillämpningsprogram?
DSV har under åren 1999 och framåt utvecklat ett eget
system "Daisy" för den interna administrationen. Gör
en utvärdering av om Daisy har lönat sig. Vad har utvecklingen
av Daisy kostat, vad kostar driften av Daisy, hur mycket tjänar
man på effektivare verksamhet till följd av Daisy?
(Statliga myndigheters information på Internet. Välj
ett antal statliga myndigheter som allmänheten ofta har behov
av kontakt med. Intervjua ett antal människor om frågor,
som de kan ha behov av att ställa till dessa myndigheter. Kolla
hur lätt det är att få fram svar via myndigheternas
webbsajter. Exempel på frågor: "Hur stort är
basbeloppet för allmän försäkring", "Kan
jag få
studiemedel under sommaren", "Hur deklarerar jag en förlust
vid försäljning av fondandelar", "Försäkringsbolaget
vägrar betala för min förstörda cykel, vad
kan jag göra?". Läs gärna "Öppna
System"
nr 1/2001 och 3/2003 från Statskontoret. I Öppna System
3/2003 berättas sid 21 om en undersökning utförd
av riksrevisionen, som visat att statliga portalar ofta är
svåra
att hitta i, och på sid 23 om en uppsats vid institutionen
för
nordiska språk om offentliga startsidor på Internet.
(Andra har skrivit liknande uppsatser, men om du väljer en annan
statlig myndighet
kan du göra en liknande uppsats.)
Missbrukshantering hos Internet-leverantörer.
Enligt den s.k. BBS-lagen (och även av andra skäl) har Internet-leverantörer
i Sverige vanligen en s.k. "abuse"-tjänst som hanterar
klagomål på olaglig information på leverantörernas
webbsidor. Denna tjänst kan då ta bort sidor som är
olagliga eller diskussionsgrupper där mycket olaglig information
finns. Gör en inventering av hur dessa tjänster fungerar,
vilka slags klagomål de får in, vilka typer av information
som de tillåter och tar bort.
Utveckla
ett program, som kan fungera som en "helper" till webbläsare
och e-post-program. Programmet skall "packa upp" en fil
i MHTML-format, och producera en mapp så att den som tittar
på "index.html" i mappen med en webbläsare kan
läsa hela MHTML-dokumentet. Denna funktion finns redan inbyggde
i vissa webbläsare, men när detta skrivs (november 2000)
bara i Windows-miljö, inte i Unix, Linux och Macintosh-miljö.
Utarbeta att klassificeringssystem för att klassificera olika
webbläsares kapabiliteter ifråga om HTML, CSS och XML.
Systemet skall kunna användas av en webbserver för att kunna
skräddarsy utmatningen till varje mottagares webbservers kapabiliteter.
Klassificera ett antal generationer av webbläsare med detta system.
Datorstöd för demokrati: Gör
en inventing av produkter, företag och tjänster på
marknaden i Sverige, och vilka produkter och tjänster vill politikerna
ha och har politikerna valt att utnyttja. (Exempel på produkter-tjänster:
Omröstningar, icke-samtidiga forum, chat, information om offentliga
beslut, remisser till allmänheten.)
Testa hur väl olika e-post-program stödjer standarderna
för Delivery och Receipt Notifications. Resultatet av ditt arbete
kan bli stöd för framtida standardiseringsarbete inom IETF.
Det finns en massa allmänt kända föreställningar
om hur en webbsida bör se ut och fungera. Testa någon
av dessa i försök med verkliga användare. Exempel
på
föreställningar att testa:
Verdana och Georgia är de mest lättlästa typsnitten
Textrader är mest lättlästa
om det går 40-60 tecken/rad)
Om en sida har mycket grafik som tar tid att ladda ner, blir
användarna missnöjda
Det är OK med små tecken (relativ storlek 1 eller
2) om bara det inte är för många tecken/textrad
Information bör organiseras i grupper om högst 7 enheter
per grupp (vid fler, dela in i subgrupper)
Logisk hierarkisk struktur av en webbsida i delar och underdelar
är viktigt
Man skall pressa in maximal information i det som syns på
skärmen av toppen på första webbsidan, även
om det känns hoptryckt, för många bläddrar
aldrig längre fram
Det är lätt att hitta mer exempel, läs bara någon
webbdesignbok eller webbdesignsida.
Folk tolererar dåliga svarstider om de får någon
information fort, och inte bara sitter och väntar.
(Andra
har skrivit liknande uppsatser, men det går att egna variationer
på ämnet.)
(Specificera hur forumsystemet KOM 2002 (http://cmc.dsv.su.se/KOM2002)
kan utvidgas för att stödja terminologidatabaser med
inbyggd möjlighet att knyta forum till varje term i terminologidatabasen.)
Använder sig folk av mottagningsbekräftelser? Internets
standarder har sedan 1996 inkluderat funktioner för att få
mottagningsbekräftelser på epost (RFC 1894, 1891) och sedan
1998 haft funktioner för lästbekräftelser (RFC 2298).
Hur vanligt är det att (a) e-post-programvaror stödjer dessa
funktioner (b) användare använder sig av möjligheterna
att explicit styra om de vill ha sådana bekräftelser. Utred
och diskutera. (Man kan även tänka sig andra typer av utredningar
av hur mycket olika funktioner i olika Internetstandarder verkligen
används.
Listserver software: Make an overview of existing listserver software
products and their functionalities, including user-friendliness.
(Applet for submitting HTML: Some programs allow people to submit
HTML-formatted messages through the web. The standard text box in
HTML, however, is not very good for editing HTML. Would it be possible
to develop an applet, which will make it easy for people to write
(a simple subset of) HTML into messages, which they submit through
the web, for example to forum systems or web hotels.)
Client side proxies can be used to remove content (cookies, Java,
adverts), modify content (remove blink, GIF animation), Security (anonymisation,
blocking), logging, acceleration, adding content (annotations, related
links). Make a through study of this, test some client side proxies,
propose your own ideas. Well-known is the Muffin proxy.
Altruism on the Internet. Why are people willing to help other people
so much on the Internet. How common is it? Is it really altruism?
(Torgny Tholerus vid DSV har utvecklat en forumprogramvara, KOM
2002. Han har valt att utveckla en egen databas, mycket baserad
på användning av Unix filsystem. Alternativt kunde
man tänka sig att använda ett databassystem, t.ex.
Microsoft SQL server, Oracle eller DB2 och ett utvecklingsverktyg
för websystem,
t.ex. Microsoft Visual InterDev och Microsoft Visual Studio. Gör
en testimplementering av en del av funktionerna i KOM 2002 med
några
av dessa metoder, och jämför de olika metoderna. Jämförelsen
bör innefatta mätningar som visar datorbelastning och
kapacitetsgränser,
men kan även innefatta bedömning av hur utvecklingsarbetet
och kvalitén på koden påverkas av de olika
metoderna.)
Folk klagar ofta över att det är så svårt
att hitta information på Internet, och att sökmotorerna
returnerar hudratals irrelevanta dokument men inte det man söker
efter. Analysera hur folk gör när de söker på
Internet, vad orsaken till problemen är och hur man kan få
det att fungera bättre.
Det finns undersökningar och argument både för att
kommunikation via e-mail ökar och minskar risken för missförstånd
jämfört med ansikte-mot-ansikte-kommunikation. Skriftlig
kommunikation är mera exakt, och vid ansikte-mot-ansikte-möten
är det inte ovanligt att man tror sig ha kommit överens,
men har olika uppfattning om vad det är man kommit överens
om. å andra sidan är det känt att skriftlig diskussion
via e-post ibland kan dra ut på tiden med ständigt upprepade
argument och utan vilja att förstå varandra. Pröva
vad som är riktigt genom att genomföra några experiment,
dår olika personer får klara ut problem via e-post och
genom att träffas. (20 p.)
Företag kan via Internet samla in, och sälja till varandra,
uppgifter om sina kunder. Hur mycket förekommer detta, och vad
är lagligt och olagligt i Sverige, andra EU-länder, USA.
Kvalitet på websidor: Installera och testa programvaran http://www.nist.gov/webmetrics
genom att göra en kvalitetsvärdering av DSVs websidor. Utvärdera
hur bra denna programvara är, titta på andra liknande programvaror,
göra en översikt över denna typ av program och föreslå
förbättringar i framtida sådana programvaror.
Förr i tiden var de flesta dokument
på Internet rena textdokument. Numera används HTML-formatet
mycket för webdokument, medan dokument i e-post och Usenet News
fortfarande huvudsakligen är i textformat. En hypotes är
att HTML-formatet ger längre skrivtid men effektivare läsning.
Detta borde då innebära att HTML "lönar sig"
sammanlagt i tid för läsare och skrivare om antalet mottagare
är tillräckligt stort. Syftet med denna uppsats är
att genom praktiska experiment testa hur mycket tiden att skriva och
att läsa olika typer av dokument skiljer sig mellan formaten
ren text och HTML, och därur räkna ut vid vilket antal läsare
som HTML eventuellt blir mera lönsamt än vanlig enkel text
(20 poäng). Se även http://www.landfield.com/usefor/1998/Apr/0175.html
och (i RTF format) http://dsv.su.se/jpalme/reports/c10166.rtf,
(i AdobeAcrobat format: http://dsv.su.se/jpalme/reports/c10166.pdf.
Ett vanligt sätt att ta reda på önskvärda funktioner
i datorprogram är att intervjua användare. Men användarnas
svar i sådana enkäter styrs ofta av andra faktorer än
de man tänker sig. Undersök detta problem genom att intervjua
ett antal användare av e-post-program, om vilka funktioner de
helst vill ha i bra e-post-program. Ta även reda på vilka
e-post-program de har erfarenhet av, och analysera sedan data för
att se hur deras önskemål styrs av vilka program de har
erfarenhet av.
Gruppstorlek vid gruppkommunikation: Det är välkänt
att bästa storleken på en arbetsgrupp oftast är 1-7
personer. Gäller detta även om arbetsgruppen huvudsakligen
kommunicerar via skriftlig kommunikation (e-post och liknande). Eller
är en annan gruppstorlek bättre då? Det har t.ex.
hävdats att den skriftliga kommunikationen, med längre tid
att skriva och kortare tid att läsa, möjliggör större
gruppstorlekar. Uppsatsen bör inte endast baseras på enkäter,
utan också på försök eller analys av verkliga
gruppers framgångar i olika gruppstorlekar och med olika medier.
Vilka yrkesroller tänker sig studerande vid DSV-s olika utbildningslinjer,
varför har de valt att läsa vid DSV, i vilken mån
beror det på förväntad yrkesroll, passar utbildningen
till dessa förvätningar. Tag ev. även med studerande
vid D-linjen på KTH i undersökningen. Tag ev. även
reda på om de verkliga framtida yrkena stämmer överens
med förväntningarna.
Analysera diskussionerna i några elektroniska diskussionsgrupper,
och undersök i hur hög grad som folk instämmer med
varandra eller invänder mot varandra.
Internet har gett starkt ökade möjligheter för vem
som helst att kommunicera med vem som helst via websidor, e-post,
newsgroups m.m. Fråga: Använder folk detta för att
i ökad utsträckning kommunicera med andra människor
med samma intressen, värderingar och verklighetsmodeller, eller
använder folk detta för att få information om och
kontakt med människor med annorlunda intressen, värderingar
och verklighetsmodeller?
Arkivering av Internet. Behöver informationen på Internet
långtidsarkiveras för framtida forskning? Vilken sådan
arkivering görs idag, vilken behöver göras?
Publicering av vetenskapliga tidskrifter på Internet. (a)
Hur mycket förekommer det, hur bra fungerar det (b) använder
man speciell programvara för produktionen, hur fungerar den i
så fall, hur borde den fungera, vilka krav bör man ställa
på en sådan programvara.
Reklam i web-sidor : Lönar
den sig för (a) annonsörerna (b) de som säljer annonsplatser?
Hur fungerar den, hur upplevs den av annonsörer, annonssäljare
och konsumenter?
Censur av Internet: Gör en översikt över vilka försök
som gjorts i olika länder att censurera Internet (t.ex. Kina,
Singapore, Tyskland, Sverige och USA).
Är PICS ett misslyckande? PICS skall hjälpa föräldrar
att hindra sina barn att se olämplig information på Internet.
Men många hävdar att det inte finns databaser för
PICS som gör det användbart. Databaser som räknar upp
bara "tillåtna" web-sidor gör Internet för
litet och ointressant, databaser som räknar upp förbjudna
web-sidor är för ofullständiga, säger man. Stämmer
det?
IETFs standarder utarbetas till stor del via e-post mellan tekniker.
Dessa har ibland mera förståelse för tekniska frågor
än användaraspekter. Analysera detta genom att läsa
igenom diskussionerna i en eller flera IETF-grupp och klassificera
hur mycket tid som ägnas åt olika frågor, och hur
viktiga dessa frågor är för användarna av e-post.
T.ex. ietf-drums vore bra objekt för en sådan studie.
Många tror att datorer används för att göra
saker till lägre kostnad än utan datorer. Men istället
har datorer ofta använts till att göra saker på krångligare
sätt till samma eller till och med högre kostnad. Det krångligare
sättet kan innebära ett bättre sätt, men det är
inte säkert. Försök att utreda vad som är sant,
genom att ta ett antal exempel på välkända datoranvändningar
och utreda hur kostnad, nytta etc. ändrats när man datoriserat
uppgifterna, eller när man bytt från enklare till mer avancerat
program/dator.
Skriva ett program e-mail-lint, which checks if the syntax of an
e-mail message agrees with the IETF standards, similar to c-lint and
weblint.
Utred och specificera hur det välkända datorprogrammet
Listserv (ett program för mailing-listor) kan utvidgas med funktioner
som gör det till ett icke-samtidigt konferenssystem.
Roller, rollelement och behörighet. Många datorsystem
bygger på att användarna tilldelas olika roller, och för
varje roll har viss behörighet, beskriven av ett antal rollelement,
vilka utgör elementära behörigheter. Uppsatsen skall
studera existerande system och teori inom området, och speciellt
titta på de risker som en alltför hård rolluppdelning
kan innebära för verksamhetens flexibilitet.
Datorstöd för beslut om tidpunkt via mailinglistor. Beslut
om tidpunkt för ett sammanträde måste ibland tas
via mailinglistor. Detta blir ofta väldigt klumpigt. Med en
väl
konstruerad mail server borde processen väsentligt kunna underättas.
Ämnet avser inte system där allas kalendrar fullständigt är tillgängliga
för systemet.
Utveckla ett datoriserat lexikon över datatermer. Lexikonet
skall bl.a. kunna användas av studerande vid DSV som undrar över
någon dataterm. Poster i lexikonet skall kunna finnas på
både engelska och svenska, plats bör finnas för definition.
Lärare vid DSV skall enkelt kunna lägga till nya termer
till lexikonet (20 poäng)
Utveckla ett program som gör statistik på WWW: Hur stor
andel av weben är skriven i olika språk, använder
sig av olika format (HTML, PDF, TEXT, etc.) genom en robot som scannar
web-världen och sammanställer sin statistik.
JP gjorde för över 20 år sedan en serie studier
av hur Sveriges första BBS, KOM, användes (medeltid att
läsa
ett meddelande, medeltid att skriva ett meddelande, hur användningen
fördelas över dygnet, vilka som kommunicerade om vad
på
vilket avstånd, kostnads- nytto analys m.m. Gör om delar
av dessa studier på Internet idag), med samma metoder som
jag använde för 15 år sedan.
Utveckla en multimedia-version av någon delkurs eller del
av delkurs vid DSV.
Innehållsanalys av texter som en forskningsmetod vid studier
av textbaserade kommunikationssystem. Arbetet innefattar inventering
av vad som gjorts, förslag till metoder och eventuellt utveckling
av programstöd för någon vald metod. Test av metoder
på något existerande material kan också ingå.
Kan man ur låntagares lån vid Stockholms Stadsbibliotek
härleda en databas som kan ge andra låntagare råd
om vilka
Kan man uppnå högre kvalitet på information i Internet
genom att låta användare kvalitetssätta varandras
websidor och lagra informationen i en databas? Vad har andra redan
gjort? Hur skulle en sådan databas bäst fungera? (10-20
poäng).
De flesta programvaror har ett fönster "Inställningar"
där användaren kan modifiera programmets funktion efter
sina egna önskemål. Gör en studie, på något
eller några lämpliga företag, av i hur utsträckning
som användarna har ändrat dessa inställningar från
de förvalda värden som är satta när de först
installerade programmet (10 eller 20 poäng).
Analys av begreppet kritisk massa som avgörande för framgång
vid användning av datorstödda konferenssystem. Metod: Dels
litteraturstudier, dels insamlande av empiriskt material och bearbetning
av detta med statistiska metoder. (10 eller 20 poäng.)
Någon studie inom området filtrering av meddelanden
på grundval av användarens intressen. Studien kan t.ex.
innefatta en jämförelse av hur lätt det är att
filtrera som man vill med olika existerande filterprogram. (10 eller
20 poäng.)
Analys av filtreringsbehov genom att låta vana användare
av Usenet News titta på artiklar i newsgroups och göra
filtreringsbedömningar. (10 eller 20 poäng.)
Datorstött hemarbete. Hur vanligt
är det, vad är erfarenheterna? (10 poäng.)
Klientprogramvaror för elektronisk post, en översikt över
programvaror, vilka funktioner de erbjuder och användarnas behov.
(10 eller 20 poäng.))
Konverteringsprogram mellan olika format för e-post. Marknadsöversikt,
funktionsöversikt. (10-20 poäng.)
Förekommer mobbning i elektronisk post och datorstödda
diskussioner (konferenssystem, BBS-er, Netnews, IRC, Mud m.m.). Med
mobbning avses att någon viss person på ett överdrivet
sätt utsätts för andras ringaktning, att denna persons
förslag kritiseras och förlöjligas på ett starkare
sätt än om förslagen kommit från någon
annan o.s.v. Frågan bör både analyseras ur mobbarens
och den mobbades synvinkel. Kan personer känna sig mobbade, utan
att andra personer upplever att personen är mobbad? Vad är
orsakerna till och effekterna av detta slag av mobbning, och vad kan
behöva göras för att förhindra mobbning? (10 poäng.)
Standard och verklighet. Intervjua ett antal personer som arbetat
med att implementera system enligt standarder inom dataområdet,
för att undersöka i hur hög grad verkligheten (det
som man implementerar) avviker från det som står i standarden,
och i så fall varför och på vilket detta påverkar
implementeringsarbetet. (10-20 poäng.)
Kvalitet i Internet. Gör en utredning av hur hög kvalitén
är på den information som finns i Internet, och metoderna
att hitta informationen, och föreslå åtgärder.
(10-20 poäng.)
Upphovsrätt i Internet. Vilka regler och sedvänjor gäller?
Vilka önskemål har användarna? Behövs åtgärder?
(Kontakta marsha-w@uiuc.edu, hon har idéer). (10 poäng).
Elektroniska marknader: Vilka är behoven av och möjligheterna
för tjänster i näten. Kan specialiseras till viss grupp
av tjänster, t.ex. banktjänster, "postorder",
utbildning, underhållning, "uppslagsböcker",
samhällsinformation. (10 poäng).
Produktion av elektroniska tjänster: Hur går det till,
vilka är arbets- och marknadsvillkoren. (10 poäng).
Översikt över marknaden för Internet-produkter och
tjänster i Sverige. (10-20 poäng).
Kommersiella BBS-er i USA: America online, Bix, Compuserve, GEnie,
Prodigy m.m. (10-20 poäng).
Fidonet - översikt över tjänster, användning
och begränsningar. (10 poäng)
Användning av datornät för samhällsinformation
och samhällsdialog. (kommunikation mellan politiska beslutsfattare
och allmänhet) (10 poäng).
De politiska partiernas BBS-er i Sverige: Hur används de, vad
har de för nytta och begränsningar (10 poäng).
Minitel-tjänsten i Frankrike: Hur används den, varför
har den lyckats, kan vi göra något liknande i Sverige,
jämförelse med Internet. (10-20 poäng, du bör
förstå franska om du väljer denna uppgift).
Dokumenthanteringssystem och WWW
Date:
Tue, 02 May 1995 13:03:00 +0200 From: EDT.EDTJKB@memo.ericsson.se
To: JPALME@dsv.su.se Subject: Ex-jobbsidéer --- Received from EDT.EDTJKB
+46 8 7263674 95-05-02 13:03
Hej Jacob,
Jag heter Johan Kullberg
och har tidigare studerat gamla systemvetenskapliga linjen vid DSV (examen april
1994).
Jag har i mitt arbete på LM Ericsson Data stött på
en del dokumenthanteringssystem, och fick en idé till något som kanske
kan bli ett lämpligt examensarbete för en eller två studenter.
Antingen i form av C-uppsats eller Masters-uppsats.
De här dokumenthanteringssystemen
syftar till att stödja ett företags dokumentadministration, t ex genom
att hålla reda på diairenummer, uppdateringslåsning på
dokument som godkänts, behörighetskontroll, revisionshantering, arbetsflöden
("workflows") och mycket annat. Vad som slog mig när jag för
några veckor sedan tog mina första steg i WWW-världen, via NetScape,
var att WWW-principen kanske kunde bli ett alternativ till att införskaffa
komplex och dyr programvara. Dokumenthanteringssystemen brukar innebära kostnad
för såväl serverprogramvara, klientprogramvara som en databashanterare
(t ex Oracle) i servern. Lägg märke till att man inte behöver använda
WWW-tekniken via Internet (detta ligger knappast i linje med säke rhetskrav
för dokumenthantering) men det går utmärkt att använda Internets
protokoll i t ex Ericssons interna kommunikationsvärld. Så sker redan
idag med WWW, FTP, News mm.
Mitt snabba utkast till uppdrag är följande:
-
Identifiera viktig funktionalitet hos de programvaror som finns på marknaden
inom dokumentadministration
- Hur täcks detta av den funktionalitet
som idag finns på Internet (dvs WWW, News, FTP och andra protokoll)
-
Vad täcks inte och vad krävs för att åstadkomma täckning?
-
Fördelar och nackdelar Internetbaserad lösning jämfört med
dokumenthanteringssystemen, inkl kostnader och intäkter för både
säljare och kund.
Jag vänder mig till Dig eftersom jag antar att
idén åtminstone delvis starkt berör Dina områden. Har
DSV kanske någon "idébank" för uppsatsförslag
som detta skulle kunna placeras i, rentav?
Om någon är intresserad,
kan jag lämna mer information i någon form. Det är *inte* ett
uppdrag beställt av LM Ericsson Data (i alla fall än så länge),
utan det är helt och hållet mitt initiativ. Problemet kan attackeras
både med och utan att företags medverkan.
Jag tror avslutningsvis
att det är ett intressant och kanske strategiskt område - dokumenthantering
är lite "inne" just nu, speciellt ihop med "workflows",
och WWW har ju varit på tapeten en tid.
Med vänlig hälsning,
Johan Kullberg
edt.edtjkb@memo.ericsson.se tel 726 36 74 (dagtid)
Chefer
får för mycket e-post
>Return-Path:
johnny.tedenfors@tele.su.se >X-Sender: johnny@gandalf.tele.su.se >Date:
Thu, 26 Feb 1998 08:29:38 -0100 >To: hoek@dsv.su.se >From: Johnny Tedenfors
<johnny.tedenfors@tele.su.se> >Subject: Ang Ex.jobb >X-MIME-Autoconverted:
from quoted-printable to 8bit by info.dsv.su.se > >Hej! > >Jag fick
tag på en fråga som handlar om e-mail och chefers behov av >både
tillgänglighet och avskilldhet. > >Finns det någon hos er som
skulle kunna joba med en utredning/exjobb >kring frågan "Chefer
får för mycket e-post." Perspektivet är >både tekniskt
ochorganisatoriskt. > >Ett stort försäkringsbolag (SPP) har lyft
fram frågan. > >Bästa hälsningar > >Johnny Tedenfors.
>
Analys av KEI-faktor
En bra algoritm för KEI bör fungera så att det är
stor korrelation mellan KEI och en sidas placering
i Googles sökresultatlista. Detta skulle man kunna
testa genom att gå igenom de sidor som jag optimerat
i Web4Health, och dels beräkna KEI med olika
algoritmer, dels ta reda på var sidorna befinner
sig t.ex. bland de 100 första länkarna i Googles
sökresultatlistan. Ju bättre korrelation, desto
bättre KEI.
Ovanstående är inte helt riktigt. I KEI ingår ju en
faktor av hur ofta folk söker på en viss sökfras. Det
kan vara bättre att hamna på tredje plats i Googles resultat för en vanlig
sökfras, än att hamna på första plats i Googles resultat för en sällan
använd sökfras. Så faktorn i KEI som baseras på hur ofta en sökterm används är
ju inte direkt korrelerad med positionen i Googles sökresultat. Utan
för
att bedöma
värdet
på den
faktorn, får man kolla på verkliga antalet externt
inkommande inträden för en viss sida. Och det vet vi för
Web4Health, men kan inte ta reda på får godtyckliga sajter.
Detta är alltså en fördel med att göra er studie på sidor
från Web4Health.
Man behöver inte, för att göra en sådan undersökning,
se på vilken placering sidorna hade innan jag gjorde
optimering av dem.
Man behöver inte egentligen titta på andra sidors
placering i Googles resultat, förutom följande:
Wordtrackers KEI beräknar konkurrensen som antalet
sidor som Google uppger sig hitta med samma söksträng.
Denna metod att beräkna KEI tar ingen hänsyn till
page rank för de konkurrerande sidorna. Man kan
definera en bättre KEI som tar hänsyn till detta.
Jag skulle tro att det räcker med att ta reda på page rank för de första tre, möjligen första
fem eller första tio sidorna i Googles lista över
resultat på en söksträng, för att kunna beräkna
en bättre KEI som tar hänsyn till konkurrenternas
page rank.
Min tanke var att ni skulle ta de sidor och sökfraser som jag sökmotoroptimerat
Web4Health för (eller ett urval av dem). Jag kan tillhandahålla
en lista över sådana fraser. Sedan skulle ni ta reda på
(Hur bra position Web4Health har bland de första hundra svaren
från
Google med dessa sökfraser.
Beräkna KEI för dessa sidor dels med Wordtrackers två metoder,
dels med egna metoder. I de egna metoderna skulle följande faktorer,
som inte ingår i KEI, tas i beaktande:
Förekomst av sökfrasen i interna länkar till
sidan
Färekomst av sökfrasen i externa länkar till
sidan
Var i sidan som sökfrasen fanns (i titel, i rubrik, i
fetstil, i början, inte i början).
Kolla hur titelns
längd påverkar, blir en sökfras
i en lång titel utspädd och mindre bra.
Konkurrensen beräknad på ett mer kvalificerat sätt än
Wordtracker gör. Wordtracker titta ju bara på det
totala antalet sidor enligt t.ex. Google som innehåller
strängen, men ingenting
om egenskapen hos dessa sidor. Vore det bättre att beräkna
konkurrensen bara på de sidor som innehåller
söksträngen i titeln
(Google har kommando för det). Vore det bättre
att ta hänsyn
till page rank för konkurrenterna? Av enkelhetsskäl
föreslår
jag att denna grundligare konkurrensanalys bara görs
på t.ex.
de första tre eller första fem sidorna som Google
hittar med resp. söksträng.
Sedan skulle ni beräkna korrelation mellan var Web4Health-sidan
hamnar, med olika KEI-faktorer beräknade på olika sätt,
och hitta den KEI-faktor som har starkast korrelation med god placering
av sidan i
Googles sökresultat.
Det kunde även vara intresse att titta i loggfilerna över besökare
på Web4Health den senaste månaden och se hur sidan log till där.
Då bör man titta på den tabeller som visar den sida som
en besökare först kommer till Web4Health, inte sidor som folk hoppat
vidare till inom Web4Health. Denna statistik finns på http://web4health.info/webalizer-w4h/
under rubriken "Top 1000 of 3899 Total Entry Pages".
Ni kunde även titta på hur vanlig söksträngen var
bland de som gick till Web4Health. Detta kan ni se på samma statistiksida
under rubriken "Top 1000 of 21353 Total Search Strings".